主页 > 元宇宙 > 正文

LeCun领导下的Meta AI,押注自监督

2022-09-06 11:59来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

Meta 的 MAE 建立在一种名为 Transformer 的神经网络架构基础之上。

自监督学习真的是通往 AGI 的关键一步?

Meta 的 AI 首席科学家 Yann LeCun 在谈到「此时此刻要采取的具体措施」时,也没有忘记远期的目标。他在一次采访时说:「我们想要构建像动物和人类一样学习的智能机器。」 近几年,Meta 发表了一系列关于 AI 系统自监督学习(SSL)的论文。LeCun 坚定地认为,SSL 是 AI 系统的必要前提,它可以帮助 AI 系统构建世界模型,以获得类似人类的能力,如理性、常识,以及将技能和知识从一个环境迁移到另一个环境的能力。 他们的新论文展示了一种被称为掩蔽自编码器(MAE)的自监督系统如何学会从非常零散、不完整的数据中重建图像、视频甚至音频。虽然 MAE 并不是一个新的想法,但 Meta 已经将这项工作扩展到了新的领域。 LeCun 说,通过研究如何预测丢失的数据,无论是静态图像还是视频或音频序列,MAE 系统都是在构建一个世界模型。他说:「如果它能预测视频中即将发生的事情,它必须明白世界是三维的,有些物体是无生命的,它们自己不会移动,其他物体是有生命的,很难预测,一直到预测有生命的人的复杂行为。」一旦 AI 系统有了一个精确的世界模型,它就可以使用这个模型来计划行动。 LeCun 说,「智能的本质是学会预测。」虽然他并没有声称 Meta 的 MAE 系统接近于通用人工智能,但他认为这是通往通用人工智能的重要一步。 但并非所有人都同意 Meta 的研究人员走在通往通用人工智能的正确道路上。Yoshua Bengio 有时会与 LeCun 就 AI 领域的重大想法进行友好的辩论。在给 IEEE Spectrum 的一封电子邮件中,Bengio 阐述了他们在目标上的一些不同和相似之处。 Bengio 写道:「我真的不认为我们目前的方法(无论是不是自监督)足以弥合人工与人类智能水平的差距。」他说,该领域需要取得「质的进步」,才能真正推动技术向人类规模的人工智能靠拢。 对于 LeCun 的「对世界的推理能力是智能的核心要素」这一观点,Bengio 表示赞同,但他的团队并没有把重点放在能够预测的模型上,而是放在了能够以自然语言的形式呈现知识的模型上。他指出,这样的模型将允许我们将这些知识片段结合起来,以解决新问题,进行反事实模拟,或研究可能的未来。Bengio 的团队开发了一种新的神经网络框架,它比致力于端到端学习的 LeCun 所青睐的框架更具模块化的性质。 大火的 Transformer Meta 的 MAE 建立在一种名为 Transformer 的神经网络架构基础之上。这种架构最初在自然语言处理领域走红,之后扩展到计算机视觉等多个领域。 当然,Meta 并不是第一个成功将 Transformer 用到视觉任务中的团队。Meta AI 的研究者 Ross Girshick 介绍说,谷歌在视觉 Transformer(ViT)上的研究启发了 Meta 的团队,「ViT 架构的采用帮助(我们)消除了试验过程中遇到的一些障碍」。 Girshick 是 Meta 第一篇 MAE 系统论文的作者之一,这篇论文的一作是何恺明,他们论述了一种非常简单的方法:掩蔽输入图像的随机区块并重建丢失的像素。 这种模型的训练类似于 BERT 以及其他一些基于 Transformer 的语言模型,研究人员会向它们展示巨大的文本数据库,但有些词是缺失的,或者说被「掩蔽」了。模型需要自己预测出缺失的词,然后被掩蔽的词会被揭开,这样模型就能检查自己的工作并更新自己的参数。这一过程会一直重复下去。Girshick 解释说,为了在视觉上做类似的事情,研究小组将图像分解成 patch,然后掩蔽一些 patch 并要求 MAE 系统预测图像缺失的部分。 该团队的突破之一是意识到,掩蔽大部分图像会获得最好的结果,这与语言 transformer 有着关键区别,后者可能只会掩蔽 15% 的单词。「语言是一种极其密集和高效的交流系统,每个符号都包含很多含义,」Girshick 说,「但是图像——这些来自自然世界的信号——并不是为了消除冗余而构建的。所以我们才能在创建 JPG 图像时很好地压缩内容。」 Meta AI 的研究人员试验需要掩蔽多少图像获得最佳效果。

99科技网:http://www.99it.com.cn

相关推荐
思必驰IPO:营收增速大幅下滑,硕博研发人员占比仅三成 思必驰IPO:营收增速大幅下滑,硕博研发人员占比仅三成

思必驰也在招股书中谈到,竞争加剧可能导致公司产品价格、利润率或市场占有

元宇宙2022-09-06

数字经济浪潮下的区块链应用与发展 数字经济浪潮下的区块链应用与发展

联合惩戒,其实我们讲溯源,区块链不能解决防伪,但确实能够做到溯源。

元宇宙2022-09-02

合并在即,关于以太坊下半场的主题Layer2,这些你一定要知道 合并在即,关于以太坊下半场的主题Layer2,这些你一定要知道

历经多年,以太坊合并终于要来了!可以预见,以太坊合并的到来将带动Layer

元宇宙2022-08-30

商汤下棋机器人「元萝卜」,人工智能+生活的一次「碰撞」 商汤下棋机器人「元萝卜」,人工智能+生活的一次「碰撞」

AI正在以全新的方式,走进人们的生活。

元宇宙2022-08-28

腾讯幻核“停摆”:数字藏品幻觉之下的内核是什么 腾讯幻核“停摆”:数字藏品幻觉之下的内核是什么

数字藏品只有熬过合规化过程中的“阵痛”,才能在国内真正站稳脚跟。

元宇宙2022-08-28

腾讯幻核「猝死」,下一个轮到谁? 腾讯幻核「猝死」,下一个轮到谁?

数字藏品,风雨飘摇。

元宇宙2022-08-28

未来10年Web3/区块链最重要的解决方案之一,花10分钟了解一下? 未来10年Web3/区块链最重要的解决方案之一,花10分钟了解一下?

零知识证明就像三箭资本的Su Zhu和Kyle Davies一样,他们出生于上世纪八十年代,

元宇宙2022-08-28

数字科技下的创新范式 数字科技下的创新范式

数字化思想是开放、整合的思想,这恰恰与中国传统文化思维一脉相承。

元宇宙2022-08-26

腾讯幻核“停摆”:数字藏品幻觉之下的内核是什么 腾讯幻核“停摆”:数字藏品幻觉之下的内核是什么

数字藏品只有熬过合规化过程中的“阵痛”,才能在国内真正站稳脚跟。

元宇宙2022-08-25

腾讯幻核「猝死」,下一个轮到谁? 腾讯幻核「猝死」,下一个轮到谁?

数字藏品,风雨飘摇。

元宇宙2022-08-25