阿里“通义”大模型炸场WAIC,背后要从一篇论文讲起(3)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
一方面,通用大模型一直是行业研究趋势之一。 尤其是多模态多任务技术,最近更是成为一波研究潮流,不仅谷歌和DeepMind接连提出Pathway和Flamingo等多任务多模态通用大模型,艾伦人工智能研究所一直在做相关技术,就连微软前段时间“卷土重来”的BEiT-3也在延续这一思路。 无论是加强模型的“任务意识”,还是做多模态大模型,本质都是 希望能挖掘出大模型更“通用”的潜力 。 另一方面,多模态大模型本身也是趋势之一,它更有可能模仿人类构建认知的过程 。 业界目前有一类非常流行的观点,认为纯LM (语言模型) 相关的预训练模型,距离所谓的人类智能,就不是一个完全正确的道路。 正如人类无法仅从语言中学到整个世界的构造一样,AI也必须有能力从图片、文字乃至视频音频等多模态混合的数据中学到模态之间的关联,才可能进一步加强对世界的认知。 这正是模型从感知智能到认知智能的关键一步。 回望大模型发展历程,从BERT至今已经过了很长一段路,但达摩院资深算法专家黄松芳认为,AI距离AGI依旧还有很长的路要走:
大家都希望AI系统越来越接近通用或是人类智能,但说实话从技术现状来看,还是有很长一段距离。
这次提出的通义大模型,也是希望能够把底座做得更实,尽可能减少AI模型在实际场景落地的定制化成本,这才能真正体现大模型的效果,说实话这也是整个AI落地应用最具挑战性的一点。 至于这种“大一统”技术中的“任务规模”路线,是否就真的能集成大模型已有的经验,将它做到离AGI真正更进一步? 或许还得交由时间来验证,但阿里在这条路上迈出了尝试的重要一步。
99科技网:http://www.99it.com.cn

《Gee》、《Oh!》、《Run Devil Run》、《The Boys》、《I GOT A BOY》、《Mr.Mr.》...韩国
快资讯2022-09-02

Mavenoid采用了技术人员协助的视频交互支持功能和人工智能引导的自助服务功能
快资讯2022-09-01