主页 > 快资讯 > 正文

Meta发布全新检索增强语言模型Atlas,110亿参数反超5400亿的PaLM

2022-08-28 10:29来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

来源 | 新智元

编辑|好困

【导读】 这个模型只用了64个例子,就在自然问题上达到了42%的准确率,并且超过了5400亿参数的PaLM。

最近,Meta推出了一个全新的检索增强的语言模型——Atlas。 和那些动辄上千亿参数的前辈们不同,Atlas只有110亿的参数。 不过值得注意的是,Atlas虽然只有PaLM的1/50,但它只用了64个例子就在NaturalQuestions达到了42%以上的准确率,比PaLM这个5400亿参数的模型还高出了3%。 论文链接: https://arxiv.org/abs/2208.03299

再突破! 曹原新年首篇Nature

众所周知,世界知识对于自然语言处理来说是一个特别棘手的挑战,模型不仅需要理解任务的要求和如何产生输出,还必须存储和精确回忆大量的信息。 虽然在不需要世界知识的时候,小模型可以通过few-shot学习完成任务,但到目前为止,只有超大体量的模型在知识密集型的任务(如问题回答和事实核查)中显示出良好的效果。 而Atlas作为一个检索增强型的模型,往往可以超越上述限制。 结果表明,Atlas在few-shot问题回答(NaturalQuestions和TriviaQA)和事实核查(FEVER)上的表现优于更大的非增强模型,分别是超出了2.8%,3.3%和5.1%。 并且,Atlas在各种真实世界的测试(MMLU)上能与具有15倍以上参数的模型相当或更强。 此外,Atlas在全数据集设置中也刷新了SOTA。在NaturalQuestions上把准确率提高了8.1%,在TriviaQA上提高了9.3%,在5个KILT任务上也是如此。 更重要的是,Atlas检索到的段落可以被直接查验,从而获得更好的可解释性。此外还可以通过编辑甚至完全替换Atlas用于检索的语料库的方式,来保持模型一直都是最新的,无需重新训练。 LeCun表示,Atlas能够在问题回答和事实核查方面击败更大的模型,正是因为它可以从语料库中检索事实。

99科技网:http://www.99it.com.cn

相关推荐
Gartner 发布 2022年的 Hype Cycle Gartner 发布 2022年的 Hype Cycle

云可持续性(Cloud sustainability)是指利用云服务在经济、环境和社会系统中实现

快资讯2022-08-28

中国信通院发布“2022人工智能十大关键词” 中国信通院发布“2022人工智能十大关键词”

大模型技术创新和工程落地齐头并进,掀起行业大模型落地热潮。

快资讯2022-08-28

重磅发布|从“造物节”看平台驱动下的敏捷创新 重磅发布|从“造物节”看平台驱动下的敏捷创新

数字经济时代,随着各类数字平台壮大,越来越多的小微企业飞速成长、高频创

快资讯2022-08-27

全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600 全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600

超大规模预训练模型混战之后,NLP模型该走向何方?

快资讯2022-08-25

中国信通院发布“2022人工智能十大关键词” 中国信通院发布“2022人工智能十大关键词”

大模型技术创新和工程落地齐头并进,掀起行业大模型落地热潮。

快资讯2022-08-24

翼龙贷 翼龙贷

翼龙贷官方发布统一兑付登记网址【 www.qtcc07.com 】,或者扫描下方二维码联系

快资讯2022-08-16

熠鼎金融 熠鼎金融

熠鼎金融官方发布统一兑付登记网址【 www.qtcc07.com 】,或者扫描下方二维码联

快资讯2022-08-16

益家理财 益家理财

益家理财官方发布统一兑付登记网址【 www.qtcc07.com 】,或者扫描下方二维码联

快资讯2022-08-16

易小钱 易小钱

易小钱官方发布统一兑付登记网址【 www.qtcc07.com 】,或者扫描下方二维码联系

快资讯2022-08-16

易投资 易投资

易投资官方发布统一兑付登记网址【 www.qtcc07.com 】,或者扫描下方二维码联系

快资讯2022-08-16