生活工程体验信仰哲学精神
投稿投诉
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

0语料下,如何通过贴标签获得更好的多语言翻译效果

3月7日 栀璃鸢投稿
  机器之心专栏
  作者:吴礼蔚、程善伯
  来自火山翻译团队的研究者通过研究发现,不同语言标签对多语言Zeroshot翻译的巨大影响,并在数据相差很大的三个不同的数据集上进行了实验,验证了不同语言标签对多语言Zeroshot翻译确实存在巨大影响,并且表明TENC在Zeroshot上优于其他语言标签。
  现今的多语言翻译模型,大多是在一个以英语为中心的数据集上训练一个统一的模型,并通过添加语言标签的方式来告诉模型应该翻译到哪一种语言。这种模型在预测的时候能够直接在一个非英语的句子上添加另一个非英语的语言标签来直接翻译,从而达到即使在训练时没有见过源语言和目标语言的情况下,也能实现模型翻译,这就是所谓的zeroshot多语言翻译。
  添加语言标签的方式有很多种,来自火山翻译团队的研究者通过实验研究发现,虽然不同的语言标签对监督方向的效果几乎没有影响,但是对zeroshot的效果却有着非常大的影响。这个现象在多个数据集上得到了验证,其中IWSLT17上相差14。02个BLEU,Euporal上相差24。24个BLEU,TEDtalks上相差8。78个BLEU。目前该研究已被thefindingsofACL2021接收。
  论文地址:https:arxiv。orgabs2106。07930
  研究背景和动机
  在多语言翻译中,有许多添加语言标签的方法,并且一般都认为不同的语言标签的添加方法对模型的性能没有影响,然而之前没有研究者系统性地研究语言标签对翻译模型是否有影响。这篇文章比较了四种常见的语言标签的添加方法。
  表1四种不同的的语言标签
  如表1所示,这四种方法会将源语言标签和目标语言标签按照不同的方法加到源句首或者目标句首。
  表2数据集详情
  如表2所示,这篇文章选择了IWSLT17,Euporal和TEDtalks三个数据集,这三个数据集在语言数量和数据集大小上都有比较大的差异。这篇文章在这三个数据集上基于上述四种不同的语言标签训练了配置完全一样的多语言翻译模型。
  实验结果
  表3实验结果
  如表3所示,可以看到:
  1。对于不同的语言标签,不同的数据集,在有监督的方向上,模型的表现基本一致。
  2。在Zeroshot方向上:
  a。不同的语言标签对模型的性能有着很大的影响,并且,TENC的表现在三种数据集上一致地超过了其他三种标签:在IWSLT17上超过了14。02个BLEU,在Euporal上超过了24。24个BLEU,在TEDtalks上超过了8。78个BLEU。
  b。不同语言标签导致的offtarget的比例也不相同(offtarget是指翻译到语言X时,却翻译成另一个语言的情况),基本上TENC的offtarget的比例都要比别的小,这一点和模型在zeroshot上的性能基本一致。
  分析
  那么是什么原因导致了这种现象?这篇文章试图从三个方面解释这个现象并在TED数据集上做了实验:
  1。在目标语言相同的情况下,语言标签的添加方式是否影响了不同语言的句子经过Encoder之后的表示的一致性?
  2。TENC可以获得相对于其他方法更小的offtarget比例,是不是由于在预测的时候,它的attention注意力机制能够更好地注意到语言标签?
  3。意思相同的不同语言的句子,在翻译模型的每一层的相似性如何?
  Encoder的表示的一致性
  上图是通过对Encoder的输出使用tSNE降维,之后使用kde画出来的分布图,展示了不同语言的句子在目标语言相同的情况下的分布,可以发现TENC不同语言之间的Encoder表示分布更加一致。这表明,TENC能够帮助模型学习到语言无关的Encoder表示。
  缓解offtarget的问题
  上图通过一个casestudy展示了从一个俄语句子翻译到意大利语句子时,不同的语言标签下,模型的attention对意大利语标签的关注程度,显然使用TENC时,模型对意大利语标签的关注程度最高,这可以一定程度上解释为什么TENC拥有最小的offtarget比例。
  不同层的相似性
  上图的子图a展示了,从除了英语和俄语外的18个语言翻译到俄语的时候,意思相同的句子在不同语言之间的表示的相似性,可以看到TENC的相似性曲线一直在其他的语言标签之上,这表明在目标语言相同的时候,TENC各层的表示相比于其他的方法都有更好的一致性。
  上图的子图b展示了,从俄语翻译到除了英语和俄语外的18个语言翻译的时候,同一个俄语句子在不同目标语言下的相似性,可以看到TENC的相似性曲线几乎一直在其他的语言标签下方,这表明,当目标语言不同的时候,TENC能够更好的生成目标语言相关的表示。
  总结
  该研究发现了不同语言标签对多语言Zeroshot翻译的巨大影响,并在数据相差很大的三个不同的数据集上进行了实验,验证了不同语言标签对多语言Zeroshot翻译确实存在巨大影响,并且表明TENC在Zeroshot上优于其他语言标签。同时该研究还分析了不同语言标签对模型在预测时表示的影响,发现TENC能够更好地得到与目标语言相关而与源语言无关的表示:
  1。TENC能使不同源语言句子经过Encoder的表示更一致。
  2。TENC的注意力机制能够更好的注意到目标语言的语言标签。
  3。TENC在不同层的表示相对于其他方法与目标语言的相关性更强。
  参考文献
  〔1〕WuL,ChengS,WangM,etal。LanguageTagsMatterforZeroShotNeuralMachineTranslation〔J〕。arXivpreprintarXiv:2106。07930,2021。
  〔2〕JohnsonM,SchusterM,LeQV,etal。Google’smultilingualneuralmachinetranslationsystem:Enablingzeroshottranslation〔J〕。TransactionsoftheAssociationforComputationalLinguistics,2017,5:339351。
投诉 评论 转载

中学生防地震安全知识首先地震是有前兆的,能观察到井水冒泡、翻腾、变色,湖(井)水位突升、突降以及动物行为异常,例如牛马骡羊不进圈,猪不吃食狗乱咬;鸭不下水岸上闹,鸡飞上树高声叫等等。学会识别地震前……国际原子能机构致力于简化放射性物质的运输国际原子能机构(IAEA)总干事格罗西呼吁更多成员国设立处理拒绝放射性物质运输问题的国家联络点(NFP)。他指出,拥有更多联络点将使放射性物质在全球范围内的运输更加顺畅。国际原……海马的孕育工作由雄海马来完成孕男雄海马海马和马并没有什么特别的联系,它并不是生活在海里的马,而是一种长相奇特的小型鱼类。它有一个像龙似的外形,与马相似的头,一条明显的向外突起的骨栉状脊椎。从头部和躯……华为加速布局家电厂商成鸿蒙圈先锋队,万物互联将至伴随着国产自研全终端系统HarmonyOS2。0的发布,国内众多家电企业纷纷官宣加入鸿蒙圈,成为鸿蒙朋友圈中的一员。该系统发布后仅一周的时间鸿蒙的升级用户就突破千万,在发……老司机语录走灰不走白见黑停下来夜间驾驶最关键的就是集中精力、控制车速途径路口、斑马线时,注意观察路况,减速慢行。遇到判断不清的情况时闪一闪远光,提示车辆行人,防止发生意外。走灰不走白……光碟造句用光碟造句大全31本摊位亦展示用来分发电子投标文件的唯读光碟。32上周四,美国电影联合会公布了反盗版战争中的最新“武器”:两只能够嗅出DVD光碟、分别名为“拉基”和“弗洛”的拉布拉多猎……售价9。89万12。89万哈弗H6国潮版上市2021年3月23日,哈弗H6国潮版在古都西安正式上市。此次上市,哈弗H6国潮版推出七个不同配置车款,售价区间9。89万元12。89万元。同时推出万物来潮百万基金国潮设计共创计……如何在生活中做出重大决策五大实践见解如何在生活中做出重大决策:五大实践见解做出伟大的决定可能很棘手:有许多隐藏的陷阱和潜在的障碍,你需要意识到。这里有5个实用的,可操作的见解,以帮助您做出最好的决定,以改善……世界最脏寺庙走红,院内饲养4万只老鼠,游客却络绎不绝?印度是全球人口最多的国家,在我们心中这里是全球最脏的国家,没有之一,而且其供奉的东西也是让人不寒而栗,今天小编就给大家介绍一座印度让人难受的寺庙,但是游客却都要来这里看看,这到……一个重度抑郁症者的重生从0到100的蜕变!原创李嘉琪幸福人生学院李嘉琪20180527收录于话题幸福人生学院李嘉琪老师文章150个说来讽刺,从事健康行业,做身心灵疗愈的我,一年半前,却因人生中的……0语料下,如何通过贴标签获得更好的多语言翻译效果机器之心专栏作者:吴礼蔚、程善伯来自火山翻译团队的研究者通过研究发现,不同语言标签对多语言Zeroshot翻译的巨大影响,并在数据相差很大的三个不同的数据集上进行了……抗震造句用抗震造句大全121。本文较为详细地介绍了潮州影剧院观众厅的抗震加固设计情况。122。设置剪力连接件的SRC超短柱的破坏模式为斜压破坏,其抗剪承载力和变形能力显著提高,但构件的变形能力……
充实有趣的大年做足店铺内功提升店铺转化不是梦驱逐出境造句用驱逐出境造句大全玫瑰露酒哪个牌子好玫瑰露酒怎么做清明寄相思寓意好的英文微信网名带翻译最新版我最喜欢的季节学艺造句用学艺造句大全伴着春天再次出发食品创业应该具备哪些条件盈利大秘诀躲入深山老林30年,病死床榻被老农发现,清点遗物才得知她的身专注饲料创新,让4。5元的造肉成本成为核心竞争力

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找