谷歌神经机器翻译连没见过的语言它也能翻译

云资讯 2016-11-24 11:05:09 转载来源: 网络整理/侵权必删

虎嗅注：谷歌刚刚在博客中宣布，谷歌神经机器翻译系统进行了重大更新，实现了用单一模型对多语种通用表征。系统还实现“零数据翻译”，也即能够在从来没有见过的语言之间进行翻译

虎嗅注：谷歌刚刚在博客中宣布，谷歌神经机器翻译系统进行了重大更新，实现了用单一模型对多语种通用表征。系统还实现“零数据翻译”，也即能够在从来没有见过的语言之间进行翻译。这意味着传说中的“巴别塔”有望成真。而国内的那些百度、科大讯飞们又不小心被甩出了10万公里远。至少从公开的信息中是这样子的。本文载于Google Research，作者为Mike Schuster 、 Melvin Johnson 、 and Nikhil Thorat，由微信公众号“新智元（微信公众号AI_era）”编译，译者：李静怡。

　　过去10年中，谷歌翻译已从仅支持几种语言发展到了支持103种，每天翻译超过了1400亿字。为了实现这一点，我们需要构建和维护许多不同的系统，以便在任何两种语言之间进行转换，由此产生了巨大的计算成本。

　　神经网络改革了许多领域，我们确信可以进一步提高翻译质量，但这样做意味着重新思考谷歌翻译背后的技术。

　　今年 9 月，谷歌翻译改为启用谷歌神经机器翻译（GNMT）的新系统，这是一个端到端的学习框架，可以从数百万个示例中学习，并在翻译质量方面有显著提升。

　　不过，虽然启用GNMT的几种语言翻译质量得到了提升，但将其扩展到所有 103 种谷歌翻译支持的语种，却是一个重大的挑战。

　　实现零数据翻译（Zero-Shot Translation）

　　在论文《谷歌多语言神经机器翻译系统：实现零数据翻译》（Google s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation）中，我们通过扩展以前的 GNMT系统解决这一挑战，使单个系统能够在多种语言之间进行翻译。

　　我们提出的架构不需要改变基本的 GNMT 系统，而是在输入句子的开头使用附加的“token”，指定系统将要翻译的目标语言。 除了提高翻译质量，我们的方法还实现了“Zero-Shot Translation”，也即在没有先验数据的情况下，让系统对从未见过的语言进行翻译。

　　下图展示了最新 GNMT 的工作原理。假设我们使用日语和英语以及韩语和英语之间相互翻译为例，训练一个多语言系统，如动画中蓝色实线所示。

　　

　　这个新的多语言系统与单个 GNMT 系统大小一样，参数也一样，能够在日英和韩英这两组语言对中进行双语翻译。参数共享使系统能够将“翻译知识”（translation knowledge）从一个语言对迁移到其他语言对。这种迁移学习和在多种语言之间进行翻译的需要，迫使系统更好地利用其建模能力。

　　由此，我们想到：能够让系统在从未见过的语言对之间进行翻译吗？例如韩语和日语之间的翻译，系统并没有接受过日韩之间翻译的训练。

　　但答案是肯定的——虽然从来没有教过它但，新的系统确实能够生成日韩两种语言之间合理的翻译。我们将其称为“零数据”（zero-shot）翻译，如动画中的黄色虚线所示。据我们所知，这还是首次将这种类型的迁移学习应用机器翻译中。

　　零数据翻译的成功带来了另一个重要的问题：系统是否学会了一种通用的表征，其中不同语言中具有相同意义的句子都以类似的方式表示，也即所谓的“国际通用语”（interlingua）？

　　使用内部网络数据的三维表征，我们能够看见系统在翻译日语、韩语和英语这几种语言时，在各种可能的语言对之间进行转换（比如日语到韩语、韩语到英语、英语到日语等等）时，内部发生的情况。

　　

　　上图中的（a）部分显示了这些翻译的总体几何构成。图中不同颜色的点代表不同的意思；意思相同的一句话，从英语翻译为韩语，与从日语翻译为英语的颜色相同。我们可以从上图中看到不同颜色的点各自形成的集合（group）。

　　（b）部分是这些点集的其中一个放大后的结果，（c）部分则由原语言的颜色所示。在单个点集中，我们能够看到日韩英三种语言中，拥有相同含义的句子聚在一起。

　　这意味着网络必定是对句子的语义进行编码，而不是简单地记住短语到短语之间的翻译。由此，我们认为这代表了网络中存在了一种国际通用语（interlingua）。

　　我们在论文中还写下了更多的结果和分析，希望这些的发现不仅能够帮助从事机器学习或机器翻译的研究人员，还能对于语言学家和对使用单一系统处理多语言感兴趣的人有用。

　　最后，上述多语言谷歌神经机器翻译系统（Multilingual Google Neural Machine Translation）从今天开始将陆续为所有谷歌翻译用户提供服务。当前的多语言系统能够在最近推出的16个语言对中的 10 对中进行转化，提高了翻译质量，并且简化了生产架构。

　　商业部署后，实现技术上的突破

　　正如前文所说，今年 9 月，谷歌宣布对部分语种启用谷歌神经机器翻译（GNMT）的新系统，并在几种率先使用的测试语种（包括汉语）翻译质量方面得到了显著提升。

　　下面的动图展示了 GNMT 进行汉英翻译的过程。首先，网络将汉字（输入）编码成一串向量，每个向量代表了当前读到它那里的意思（即 e3 代表“知识就是”，e5 代表“知识就是力量”）。整句话读完之后开始解码，每次生成一个作为输出的英语单词（解码器）。

　　

　　要每一步生成一个翻译好的英语单词，解码器需要注意被编码中文向量的加权分布中，与生成英语单词关系最为密切的那个（上图中解码器 d 上面多条透明蓝线中颜色最深的那条），解码器关注越多，蓝色越深。

　　使用人类对比评分指标，GNMT 系统生成的翻译相比此前有了大幅提高。在几种重要语言中，GNMT 将翻译错误降低了 55%-58%。

　　不过，当时也有很多研究人员认为，当时谷歌翻译取得的“里程碑”，与其说是技术突破，不如说是工程上的胜利——大规模部署本身确实需要软硬件方面超强的实力，尤其是想谷歌翻译这样支持 1 万多种语言的商业应用，对速度和质量的要求都非常的高。但是，神经机器翻译的技术早已存在，借鉴了语言和图像处理方面的灵感，是多种技术的整合。

　　现在，只用了大约 2 个月的时间（论文首次上传到 arXiv 是 11 月 14 日），谷歌翻译和谷歌大脑团队就实现了技术上的突破——让系统在从未见过的语言对之间进行翻译，也即所谓的“zero-shot translation”。

　　不仅如此，谷歌研究人员还在论文最后做了分析，新的模型代表了实现一种“国际通用语”模型的可能。有评论称， 这可以说是实现“巴别塔”的第一步。

　　谷歌神经机器翻译系统架构

　　就在几天前，国外研究员 Smerity 在他的博客上发布了一篇分析谷歌神经机器翻译（GNMT）架构的文章，在 HackerNews、Reddit 等网站都引发了很多讨论。

　　Smerity 在博文中指出，GNMT 的架构并不标准，而且在很多情况下偏离主流学术论文中提出的架构。但是，根据谷歌特定的需求，谷歌修改了系统，重点保证系统的实用性而并非追求顶尖结果。

　　

　　【论文】谷歌的多语言神经机器翻译系统：实现 zero-shot 翻译

　　摘要如下：

　　我们提出了一种使用单一神经机器翻译（NMT）模型，在多语种之间进行翻译简洁而优雅的解决方案。不需要修改谷歌现有的基础系统模型架构，而是在输入句子的前面加入人工标记（token）明确其要翻译成的目标语言。

　　模型的其他部分（包括编码器、解码器和注意模型）保持不变，而且可以在所有语言上共享。使用一个共享的 wordpiece vocabulary，这种方法能够使用单一模型实现多语种神经机器翻译，而不需要增加参数，相比此前提出的方法更为简单。

　　实验表明，这种新的方法大部分时候能提升所有相关语言对的翻译质量，同时保持总的模型参数恒定。

　　在 WMT' 14 基准上，单一多语言模型在英法双语翻译上实现了与当前最好技术相同的结果，并在英德双语翻译上超越当前最佳的结果。

　　同时，单一多语言模型分别在 WMT'14 和 WMT'15 基准上，超越了当前最佳的法英和德英翻译结果。 在用于生产的语料库上，多达 12 个语言对的多语言模型能够实现比许多单独的语言对更好的表现。

　　除了提升该模型训练所用的语言对的翻译质量之外，新的模型还能在训练过程中将没有见过的语言对相互联系起来（bridging），表明用于神经翻译的迁移学习和零数据翻译是可能的。

　　

　　最后，我们分析了最新模型对通用语言间表征的迹象，还展示了一些混合语言时会出现的有趣案例。

编辑：admin

标签: 谷歌神经机器翻译连没见过语言也能翻译

声明：本文内容来源自网络，文字、图片等素材版权属于原作者，平台转载素材出于传递更多信息，文章内容仅供参考与学习，切勿作为商业目的使用。如果侵害了您的合法权益，请您及时与我们联系，我们会在第一时间进行处理！我们尊重版权，也致力于保护版权，站搜网感谢您的分享！

上一篇: 中美云计算将同台竞技阿里云“全球网”落成

上一篇: 全民超神英雄如何提战快速提高战力方法

猜您喜欢

云计算广泛应用推动IDC市场高速增长

2016云计算行业的10大事件

云计算的国际化进程不断加速工信部李颖

让创业和资本无缝对接第四季“创新之源”大会成功举办

云和恩墨获2016 年中国软件大会创新服务商奖

在不变中求变开启企业通信新征程盘点Unify的2016

数据中心及云计算最新政策和趋势何宝宏

数据中心及云计算产业投资机会分析黄超

新华三首批通过增强级认证云服务能力评估“国标”出炉

SaaS和公有云鼻祖Salesforce背后的低调男人

2017年值得关注的十大IaaS云发展趋势

2017年将“赋能平台，精化结构” Wish中国总裁丁浩川

运营商为何又一次成为香饽饽？

云计算巨头疯狂降价的三个逻辑月月都似双十一

青云QingCloud推出“平步青云”创业扶持计划

腾讯阿里开打云计算“世界大战” 全球化竞争比拼生态

2016ACOUG嘉年华完美收官十六位行业大咖再聚首

云和恩墨助力哈尔滨银行为互联网金融保驾护航

为高校云应用量身定制 H3Cloud OS开创教育新模式

dayCRM企业版爱尚理客荣获“2016中国移动CRM产品创新奖”

热门文章

1 科技圈风云：苹果涨价引热议，国产崛起正当时！

2OPPO Find X8s：小屏旗舰的王者归来，重新定义极致体验

3摩托罗拉Edge 60 Stylus：5000万像素主摄、骁龙7s Gen 2加持，Android 15系统首发亮相

4港元及美元货币市场ETF代币化方案落地香港：传统金融与区块链金融融合加速

5 vivo X200 Ultra 影像套装官图发布：专业影像体验再升级

6一加13T：风驰游戏内核加持，小屏旗舰的“断层领先”体验

7 一加13T：风驰游戏内核加持，小屏手机的性能革命

8旷日持久的贸易战：中国科技产业韧性胜硅谷？

9红魔10 Air：轻薄全屏旗舰，4月16日正式发布，惊艳外观抢先看

10三星Galaxy S25企业版：史无前例的八年Android系统更新及安全补丁支持

热点

比特币价格暴跌：跌破75000美元关口！

OPPO ColorOS15蝉联鲁大师2025年Q1流畅榜双冠王，引领行业优化新标杆

iPhone 17 Pro系列影像系统升级：4800万像素三摄+双景录像功能详解

iPhone 17 Pro系列：五大关键升级，引领智能手机新时代

2024年Q4全球智能手机市场报告：苹果领跑，高端化趋势显著

标签列表

大数据

win10

ios苹果之家

软件学院

编程/数据库

云计算

服务器

移动互联

评测

网站运营

科技资讯

游戏

娱乐休闲

工商与经济

电脑与网络

公司与企业

教育与培训

文学

艺术

体育与健身

新闻与媒体

卫生与健康

科学/文化

生活与服务

绘画

体育图片

综合娱乐网站

棋牌类

计算机学

石油/天然气

环境研究

群众文娱活动研究

疾病/症状资料

搜索引擎

综合网站

游戏

谷歌神经机器翻译连没见过的语言它也能翻译

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2025 All Rights Reserved.

Powered By 站长搜索

谷歌神经机器翻译 连没见过的语言它也能翻译

猜您喜欢

热门文章

热点

标签列表

分享到:

Copyright @ 2007~2025 All Rights Reserved.

Powered By 站长搜索

谷歌神经机器翻译连没见过的语言它也能翻译