谷歌Transformer解决了机器翻译中的一个难题

互联网 | 编辑: 潘翔城 2017-09-01 13:25:44转载

机器学习已经成为一种非常有用的翻译工具，但它还存在一些弱点，翻译模式倾向于逐词翻译是其中之一，可导致严重错误。

北京时间9月1日上午消息，机器学习已经成为一种非常有用的翻译工具，但它还存在一些弱点，翻译模式倾向于逐词翻译是其中之一，可导致严重错误。谷歌在iResearch博客上发表了一篇有趣的帖子，详细说明了这个问题的性质以及解决方案。该公司自然语言处理部门雅克布·乌兹考瑞特（Jakob Uszkoreit）给出了很好的解释。请思考以下两个句子：

我过了马路就到了银行（bank）。

我过了河就到了岸边（bank）。

显然，每句话中的“bank”指代不同的东西，但是，逐字翻译的算法可能很可能挑选错误的含义——因为它不知道哪一个“bank”是正确的，除非它能看到句子结尾。你稍加留意就能发现，这种歧义随处可见。

我会改写句子，当然，翻译系统不会选择这样走。如果为了这种简单的句子而修改神经网络，那将是非常低效的。

谷歌的解决方案是所谓的关注机制（attention mechanism），也就是说在翻译软件中内置一个名为“变压器”（Transformaer）的系统。它将句子中的单词逐一进行比较，以确定它们之间是否以某种关键方式相互影响——例如，看“他”或“她”是否在说话，或者像“银行”这样的词是否以特定的方式表示。

当翻译句子被构建时，关注机制将每个词与其他词进行比较，就像下面GIF所演示的那样。

如果这一切听起来很熟悉，那可能是因为本周早些时候你读过一篇报道：谷歌翻译的竞争对手DeepL也在使用一种关注机制。该公司的联合创始人提到了这个问题，他们正在为此而努力工作，他甚至提到那篇报道谷歌的文章，但显而易见，他们的产品与谷歌有所区别，非常有效，甚至好于后者的版本。

有趣的是，谷歌的方法让人们有机会看到系统的运作原理，因为Transformer给每个词提供一个与其他单词相关程度的得分，你可以看到它认为是相关的词，或者潜在的相关词：

很酷，对吧？嗯，我想是的。但也存在另一种类型的歧义，因为在英文里，“它”可以指代街道或动物，必须看到最后一个字才能确定bank的含义。人脑可以自动计算和分辨，但机器仍然必须有人教。

每日精选

nova 15系列及全场景新品发布会

北京时间12月22日14:30，nova 15系列及全场景新品发布会，我们不见不散。

标签： nova15| 全场景| 发布会| nova15发布会| 2025-12-22
IDC：三季度全球音频眼镜市场出货同比+287.5%

2025年第三季度全球智能眼市场出货量429.6万台，同比增长74.1%。其中全球音频和音频拍摄眼镜市场出货量299.4万台，同比增长287.5%。

标签：智能眼镜| AR| 2025-12-21
IDC称26年PC价格上涨15%-20%，内存短缺引发行业“完美风暴”

IDC最新市场分析报告发布了一个重磅预警，受内存价格的冲击，2026年全球PC价格将迎来15%-20%的普遍上涨。2026年，对于那些想要购置新电脑、组装玩家的成本将会越来越大，处境尤为艰难。

标签： IDC| 内存| PC| 2025-12-21
PC鲜辣报：三星DRAM陷入供应链丑闻，联想发布卷轴屏笔记本

近期科技新闻与黑科技产品频频爆发：三星DRAM回扣调查搅动存储器市场，缺货潮持续至2027年；联想将携卷轴屏电竞本登陆CES 2026，解锁移动大屏新形态；苹果启动OLED iMac研发，终于将显示技术升级延伸至桌面设备。

标签：三星| DRAM| 联想| 苹果| 2025-12-22
小米17 Ultra铁定涨价卢伟冰：肯定物超所值

在小米总裁卢伟冰的直播活动中，卢伟冰针对小米17 Ultra的定价问题进行了回答，其表示小米17 Ultra的涨价已成定局，但产品一定会物超所值。

标签：小米| 小米17Ultra| 涨价| 2025-12-22
12月25日19:00发布小米17 Ultra影像旗舰定档

小米雷军宣布，小米 x 徕卡影像战略合作升级，新一代小米夜神，小米17 Ultra同步登场，12月25日19:00发布。

标签：小米| 小米17Ultra| 发布| 2025-12-22
寅谱计算发布KLEENE智控技术及新型个人工作站Hilbert

寅谱计算发布计算机主板智控技术KLEENE以及结合SSD的AI推理加速技术，同时展示了搭载主板智控技术的桌面计算机Infplane Personal Workstation：Hilbert，该计算机为寅谱计算规划的“桌面超算”系列的初代产品。寅谱计算表示在持续提升端侧计算能力的同时，公司正推进计算与存储协同的一体化终端形态研发。

标签：寅谱| 计算| 工作站| AI| 2025-12-22
充电宝再见荣耀WIN系列标配10000mAh大电池

荣耀手机官方宣布，荣耀WIN系列将标配10000毫安时巨无霸青海湖大电池。在大电池支持下，连续开黑5小时，电量还剩大半管。边充边玩手机不烫手，操作更跟手。

标签：荣耀| 荣耀WIN| 电池| 2025-12-22
三星推出首款2nm工艺手机芯片并未集成5G基带

三星发布了旗舰智能手机芯片——Exynos 2600，这是全球首款采用2nm工艺的智能手机芯片，其采用了三星自家的2nm GAA工艺制造。

标签：三星| Exynos2600| 2nm| 基带| 2025-12-22
夸克AI眼镜G1开启预售搭载千问AI助手低至1999

阿里千问C端事业群成立后，在 AI 硬件领域动作加速。12月22日，夸克AI眼镜正式开启两款新品预售，其中G1风尚眉框款最低到手价仅1999元，可大幅降低AI随身门槛。

标签：夸克AI眼镜| 夸克G1| 千问AI助手| 1999元| 2025-12-22