阿里“通义”大模型炸场WAIC，背后要从一篇论文讲起(3)

2022-09-05 11:08来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

一方面，通用大模型一直是行业研究趋势之一。尤其是多模态多任务技术，最近更是成为一波研究潮流，不仅谷歌和DeepMind接连提出Pathway和Flamingo等多任务多模态通用大模型，艾伦人工智能研究所一直在做相关技术，就连微软前段时间“卷土重来”的BEiT-3也在延续这一思路。无论是加强模型的“任务意识”，还是做多模态大模型，本质都是希望能挖掘出大模型更“通用”的潜力。另一方面，多模态大模型本身也是趋势之一，它更有可能模仿人类构建认知的过程。业界目前有一类非常流行的观点，认为纯LM （语言模型）相关的预训练模型，距离所谓的人类智能，就不是一个完全正确的道路。正如人类无法仅从语言中学到整个世界的构造一样，AI也必须有能力从图片、文字乃至视频音频等多模态混合的数据中学到模态之间的关联，才可能进一步加强对世界的认知。这正是模型从感知智能到认知智能的关键一步。回望大模型发展历程，从BERT至今已经过了很长一段路，但达摩院资深算法专家黄松芳认为，AI距离AGI依旧还有很长的路要走：

大家都希望AI系统越来越接近通用或是人类智能，但说实话从技术现状来看，还是有很长一段距离。

这次提出的通义大模型，也是希望能够把底座做得更实，尽可能减少AI模型在实际场景落地的定制化成本，这才能真正体现大模型的效果，说实话这也是整个AI落地应用最具挑战性的一点。至于这种“大一统”技术中的“任务规模”路线，是否就真的能集成大模型已有的经验，将它做到离AGI真正更进一步？或许还得交由时间来验证，但阿里在这条路上迈出了尝试的重要一步。

99科技网：http://www.99it.com.cn

共3页:

相关推荐