主页 > 元宇宙 > 正文

MetaAI科学家解读最新模型:200+语言互译,千倍翻译数据,全球元宇宙用户自由交流

2022-08-31 12:15来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

大数据文摘授权转载自智源社区

整理:戴一鸣

编辑:李梦佳

导读: 近日,MetaAI发布了NLLB-200模型,宣布在200多种语言(其中有70%是低资源语言)上实现了任意互译。其中的亮点在于:研究者让大多数低资源语言训练数据量提升了多个数量级,相当于规模提升百倍甚至千倍;实现了200+语言翻译的平均新SOTA。 图注:NLLB团队统计的公开翻译数据(蓝色柱)和经过一系列方法后获得的训练数据(绿色柱)进行的对比。

目前,Meta已在其博客上公布了NLLB-200的最新应用:用多国语言翻译各国儿童故事。此外,利用NLLB-200实现元宇宙用户自由交流,也成为未来Meta关注的发展方向。 机器翻译一直是自然语言处理领域的重要任务。随着预训练模型的出现,机器翻译模型的性能已经得到了明显的进步。然而,当前机器翻译主要解决的是英语与其他语言的互译。有大量的语言缺乏基本的训练数据,使得构建通用机器翻译模型成为无源之水、无本之木。 怎样解决困扰通用机器翻译研究的问题?千倍翻译数据增长背后使用哪些新技术?近日,智源社区邀请NLLB-200的作者之一 , MetaAI研究科学家Maha Elbayad博士进行了详解。 作者介绍: Maha Elbayad博士是Meta AI的研究科学家,致力于研究低资源和大规模多语言机器翻译领域。在加入Meta之前,她获得了格勒诺布尔阿尔卑斯大学的应用数学和计算机科学博士学位,以及巴黎萨克雷高等师范学院和巴黎中央大学的应用数学理学硕士学位。 她的研究项目包括具有二维卷积的序列到序列模型、具有早期停止机制的计算高效Transformer解码器模型,以及具有K步等待解码机制的同声传译模型等。她共同组织了第二届自动同声传译Workshop和IWSLT 2021 & 2022同声传译共享任务。

背景

当前,机器翻译领域的面临的一项挑战是:机器翻译主要是研究英语与其他语言之间的翻译问题。例如,有法语和英语的文本,用户想从法语翻译成英语,或者从英语翻译回法语,是可以用相同模型的。但如果想从英语翻译成中文,或者其他语言,就需要训练新的模型。 机器翻译领域的“圣杯”是发展一种通用的机器翻译方法,通过一个模型来实现多种领域下两个任意语言之间的互译。据统计,目前全球有超过4000种书面语言。如果我们将其扩展到非书面语言,这个数字会上升到7000。而目前谷歌翻译能够实现大约130种语言的翻译。微软翻译到今年7月达到110种。这里需要解决的问题是,如何才能打破130种语言的数量障碍,将可翻译的语言数目增加到200种以上?我们怎样能够确保在可互译语言数量增长的同时,保证翻译的质量,并且还能考虑到建立多语言机器翻译模型所带来的伦理影响。 机器翻译领域还面临着第二个问题:如何提升无资源语言的机器翻译效果?近年来,大部分机器翻译的研究和模型的提升都集中在高资源语言上。研究者拥有的数据越多,模型就可以训练得越多,获得更准确的模型。但如果数据较少,研究者就无法获得良好的翻译模型。正所谓“富者愈富,穷者愈穷”,NLLB的研究目标是通过训练多语言翻译模型,比较来自不同资源级别的数据,并增加不同语言之间的迁移能力。这样一来,数据较为丰富的语言能够帮助哪些数据相对较少的语言来提升效果。 当然,多语言机器翻译本身是具有多面性的问题。研究者不仅需要考虑技术层面的问题,如模型的构建、训练的方法、数据清洗和过滤的方法等,还需要考虑在有了大规模多语言机器翻译模型后所带来的伦理和社会影响。在NLLB团队中有30多位成员,包括来自语言学、社会学、人工智能、数据科学等方面的多位专家,共同合作完成了这项任务。

99科技网:http://www.99it.com.cn

相关推荐
针对深度学习的“失忆症”,科学家提出基于相似性加权交错学习 针对深度学习的“失忆症”,科学家提出基于相似性加权交错学习

本文介绍了神经科学和机器学习的进一步发展。

元宇宙2022-08-28

巨头重估元宇宙,带你全方位解读元宇宙 巨头重估元宇宙,带你全方位解读元宇宙

从闻所未闻,到家喻户晓,脱胎于科幻小说的元宇宙,在过去的一年迎来了集中

元宇宙2022-08-12

现实版头号玩家来了!科学家突破VR应用瓶颈 实现高精度视觉惯性手部运动跟踪 现实版头号玩家来了!科学家突破VR应用瓶颈 实现高精度视觉惯性手部运动跟踪

原标题:现实版头号玩家来了!科学家突破VR应用瓶颈 实现高精度视觉惯性手部

元宇宙2021-10-10

为什么蜜蜂不会迷路? 德国科学家用VR跟踪蜜蜂工作时的神经信号变化 为什么蜜蜂不会迷路? 德国科学家用VR跟踪蜜蜂工作时的神经信号变化

原标题:为什么蜜蜂不会迷路? 德国科学家用VR跟踪蜜蜂工作时的神经信号变化

元宇宙2019-02-15

VR使药物发现看得见、摸得着 科学家打着游戏就把新药给研发了 VR使药物发现看得见、摸得着 科学家打着游戏就把新药给研发了

原标题:VR使药物发现看得见、摸得着 科学家打着游戏就把新药给研发了 VR能用

元宇宙2018-07-09

2018 IVRPA大会 解读中国VR“淘金热”和VR“寒冬”的现状 2018 IVRPA大会 解读中国VR“淘金热”和VR“寒冬”的现状

原标题:2018 IVRPA大会 解读中国VR淘金热和VR寒冬的现状 Kevin在迪士尼动画公司拥

元宇宙2018-06-07

东京大学的科学家使用VR运动来控制成人大型机器人 东京大学的科学家使用VR运动来控制成人大型机器人

原标题:东京大学的科学家使用VR运动来控制成人大型机器人 在上个月加拿大温

元宇宙2017-10-26

德国科学家脑洞有点大 用VR解决自动驾驶的道德问题? 德国科学家脑洞有点大 用VR解决自动驾驶的道德问题?

原标题:德国科学家脑洞有点大 用VR解决自动驾驶的道德问题? 据外媒报道,

元宇宙2017-07-23

科学家正研究用VR设备来减轻看牙医的痛苦 减少病人对止疼药的依 科学家正研究用VR设备来减轻看牙医的痛苦 减少病人对止疼药的依

原标题:科学家正研究用VR设备来减轻看牙医的痛苦 减少病人对止疼药的依赖

元宇宙2017-06-16