主页 > 快资讯 > 正文

AI模型的大一统!多模态领域乱杀的十二边形战士

2022-09-07 09:58来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

作者丨战斗系牧师@知乎 来源丨https://zhuanlan.zhihu.com/p/558533740 编辑丨极市平台 无敌的十二寸Pizza饼战士BEIT3 说在前面的话(有点小长,可以直接跳过的) 期待

在 Swin-v2 出来不久之后,我预感一个很棒的大一统模型很快就会到来了,当时,我躺在床上,给我的好伙伴写下了必胜的AI模型配方!

大数据量+大模型架构+MAE(mask data)+多模态训练方式

写下这条配方时候我其实就觉得下一个无敌的模型估计很快就可以出现了。没想到, 学都还没有开 , BEIT-3 就迎面向我们走来了。一个能在多模态领域乱杀的无敌十二边形战士,在纯视觉领域都能是妥妥的 SOTA。一个真正做到了大一统的模型框架!

疲惫

但是经过这么多轮的,大模型的轰炸。其实人工智能组成的中坚力量(实验室小作坊们)已经没有办法顶得住这些 核弹 的压力了。 这么大的模型,这么庞大的训练量,效果再炸裂又能怎样,我又复现不出来。 这种声音成为了现在开发者们的主流心声。 大家都疲惫了 ,这种工作再 棒 其实也是无效工作,follow的成本太高了。那么这时候很又前瞻性的研究员们就要站出来抵抗了,问出那个 最知乎的问题 ,那有没有大模型有没有不能覆盖到的方向呢? ”核弹“到底有没有炸不到的点呢?

其实是有的,不如我先BEIT-3的工作内容大概内容和大家讲一遍,然后慢慢和大家分析有没有这个答案吧!

为什么会有这样的一个工作?

其实先当前的大一统的思路其实很清晰。发展的方向也是主要主要沿着以下三点进行更新迭代, 合适的骨干架构 、 各任务的预训练模型 、 大参数量的模型架构。 本文的BEIT-3也是顺着这个思路对模型进行迭代的,不仅在图像+语言的方向取得 SOTA ,甚至在纯图像领域,也是一马当先,把分数又往前卷了一步!其实我觉得 ADE20k 超过了大杀器 Swin-V2 、在 coco 上虽然不是涨点很多,但是也破了 DINO 的记录,在图像分类任务上也击败了 我的白月光CLIP ,涨了0.6个点,这个可是真正无敌的存在。

合适的骨干架构— Multiway Transformer

从 Transformer 在语言翻译上的大获成功,再到ViT在视觉领域上的大放异彩,Transformer架构已经成为了视觉、语言通用的大杀器。对于多模态来说,有一个能够在语言和视觉同时work的网络架构体系,使得无缝处理多种模态的任务成为可能。但是因为视觉和语言毕竟不是一个体系的数据类型,一般来说未来适配不同的下游任务,我们都会重新设计Transformer架构。这种方案其实不利于大一统的思路发展,所以我们需要有一个整体化的架构范式,帮助我们完成大一统的理想。

99科技网:http://www.99it.com.cn

相关推荐
一加Ace Pro游戏表现圈粉,还是“不将就”的性能大咖 一加Ace Pro游戏表现圈粉,还是“不将就”的性能大咖

8月26日~28日高通在成都举办了首届骁龙嘉年华,不少消费者在嘉年华展区中体

快资讯2022-09-07

三大技术策略齐发,透露蚂蚁集团AI的“月亮与六便士” 三大技术策略齐发,透露蚂蚁集团AI的“月亮与六便士”

在一个名叫“元宇宙”的新世界,经济、政治、文化的生态将被重新构建,而新

快资讯2022-09-07

玖惠仓好不好?为什么做的人那么多?是区块链项目吗? 玖惠仓好不好?为什么做的人那么多?是区块链项目吗?

最近,玖惠仓这个名字在朋友圈里似乎非常的火,很多朋友即便没有参与但至少

快资讯2022-09-06

如何选择一款合适的奶粉?欧铂佳羊奶粉值得信赖 如何选择一款合适的奶粉?欧铂佳羊奶粉值得信赖

选奶粉,是不少新手妈妈在育儿道路上遇见的第一个拦路虎,奶粉品类多、牌子多

快资讯2022-09-06

论文修改100遍也别慌!Meta发布全新写作语言模型PEER:参考文献都会加 论文修改100遍也别慌!Meta发布全新写作语言模型PEER:参考文献都会加

Meta最近放出全新写作语言模型PEER,完全模拟人类写作过程,从打草稿到重复编

快资讯2022-09-06

三步并成一“布” ,智能助手的明日蓝图 三步并成一“布” ,智能助手的明日蓝图

文明始于工具。但是伴随科技的发展,当工具越来越多,人们的期待,却逐渐变

快资讯2022-09-06

AI驱动的自动化采购平台Fairmarkit获3560万美元C轮增资 AI驱动的自动化采购平台Fairmarkit获3560万美元C轮增资

因此,Fairmarkit数据显示,他们的客户通过Fairmarkit采购的支出,呈指数级增长。

快资讯2022-09-06

中国算力一张网布局初成,华为AI大模型时代来了 中国算力一张网布局初成,华为AI大模型时代来了

如果说算力决定了生产力,那么模型则是AI构建世界的各种建筑设计方案。

快资讯2022-09-06

ICLR Spotlight|Facebook提出无损INT8优化器,单机可以跑千亿参数模型了?? ICLR Spotlight|Facebook提出无损INT8优化器,单机可以跑千亿参数模型了??

2018年GPT、BERT预训练模型的提出吹响了大模型“军备竞赛”冲锋的号角,一场大

快资讯2022-09-06

彼合彼方“以世界一流的爬壁技术,助力客户极限高危作业” 彼合彼方“以世界一流的爬壁技术,助力客户极限高危作业”

8月31日至9月5日,以服务合作促发展 绿色创新迎未来为主题的2022年中国国际服

快资讯2022-09-06