主页 > 快资讯 > 正文

“在所有事情上打败所有人”,微软多模态新作横扫12类任务,连纯视觉SOTA都刷新了(3)

2022-09-15 13:00来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

BEiT-3,集大成者

了解了整个BEiT系列的发展历程,最后再来看一下BEiT-3。 论文共同一作 董力 ,点出了模型命名中 “ 3” 的含义: 多模态统一的预训练方式+共享Attention的多路Transformer+扩大规模的大一统 (Big Convergence) 。 如此一来,BEiT-3能在多模态任务和视觉任务中都取得SOTA也就不奇怪了。 这样一篇论文,自然吸引了行业内很多目光。 鲁汶大学一位教授认为,这代表微软在AI科研方面赶上谷歌/DeepMind、Meta和OpenAI,“重新坐上了牌桌”。 随着讨论热度升级,对论文更严格的审视目光也多了起来。 谷歌一位研究员指出,论文结果看起来简洁又令人印象深刻,就是这雷达图的坐标取值有点不太严谨。 知乎上也有网友提问,如果用了CLIP作为教师模型的话,那么来自CLIP高质量配对数据的贡献有多少,直接改改CLIP就用又会如何?

作者团队

最后再来介绍一下作者团队,BEiT-3相关研究论文的作者都来自微软。 三位共同一作分别是Wenhui Wang,Hangbo Bao(鲍航波)和Li Dong(董力)。 其中,鲍航波和董力都是从初代BEiT就参与了研究,一直贯穿VL-BEiT和BEiT v2的发展,鲍航波更是BEiT和VL-BEiT论文的一作。另一位Wenhui Wang之前也曾参与过VL-BEiT的研究。 通讯作者是微软亚洲研究院NLP小组的Partner研究经理Furu Wei(韦福如)。

99科技网:http://www.99it.com.cn

  • 共3页:
  • 上一页
  • 1
  • 2
  • 3
  • 下一页
  • 相关推荐
    增收靠补贴!营收再放缓,科大讯飞何时能“喂饱” 增收靠补贴!营收再放缓,科大讯飞何时能“喂饱”

    AI,也就是人工智能,这一行业是研究、开发计算机科学来模拟、延伸和拓展人

    快资讯2022-09-15

    Omniverse激活 “数字虫洞”,围观《星球:重启》数字人李星澜如何诞生? Omniverse激活 “数字虫洞”,围观《星球:重启》数字人李星澜如何诞生?

    AI几乎是贯穿英伟达历届GTC的不衰主题,而与AI密不可分的机器人、数字人则是

    快资讯2022-09-15

    人工智能的进步与在机器中创造人类智能不同 人工智能的进步与在机器中创造人类智能不同

    “人工智能(AI)”一词实际上有两种含义,既指将人类智能构建到计算机中的基

    快资讯2022-09-15

    岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想 岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

    特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创

    快资讯2022-09-15

    中国深度学习平台逆袭,只是因为“国潮”吗? 中国深度学习平台逆袭,只是因为“国潮”吗?

    一直到今天,柯洁也未必知道,他2017年看似输给了阿尔法狗,但实际上是输给

    快资讯2022-09-15

    “AI的命也是命”?人类与AI之间还有明确界线吗 “AI的命也是命”?人类与AI之间还有明确界线吗

    当人工智能变得越来越强,越来越多地出现在人类身边,“我们应如何看待AI”

    快资讯2022-09-15

    生物识别技术在金融领域应用 生物识别技术在金融领域应用

    生物特征作为 身份认证增强模式,加固安全认证能力。传统用户名加密码或短

    快资讯2022-09-15

    乐橙以提升人们美好生活品质为己任,推出新品,助您智慧“管”家 乐橙以提升人们美好生活品质为己任,推出新品,助您智慧“管”家

    生活条件的改善,加上科技水平的提高,家庭安全问题开始被更多人关注到。家

    快资讯2022-09-15

    【异乡味浓情,驿站度中秋】——苏州阳澄湖服务区“灯”你来 【异乡味浓情,驿站度中秋】——苏州阳澄湖服务区“灯”你来

    白居易有首诗中写道:西北望乡何处是,东南见月几回圆。9月10日正值中秋佳节

    快资讯2022-09-14