主页 > 快资讯 > 正文

谷歌、MIT「迭代共同认证」视频问答模型:SOTA性能,算力少用80%(2)

2022-09-15 13:52来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

高效视频问答的实现

研究人员将视频语言迭代共同认证算法应用于三个主要的VideoQA基准,MSRVTT-QA、MSVD-QA和IVQA,并证明这种方法比其他最先进的模型取得了更好的结果,同时模型不至于过大。 另外,迭代式共同标记学习在视频-文本学习任务上对算力的需求也更低。

该模型只用67GFLOPS算力,是3D-ResNet视频模型和文本时所需算力(360GFLOP)的六分之一,是X3D模型效率的两倍多。并且生成了高度准确的结果,精度超过了最先进的方法。

多流视频输入

对 于VideoQA或其他一些涉及视频输入的任务,研 究人员发现,多流输入对于更准确地回答有关空间和时间关系的问题很重要。

研究人员利用三个不同分辨率和帧率的视频流:一个低分辨率、高帧率的输入视频流(每秒32帧,空间分辨率64x64,记作32x64x64);一个高分辨率、低帧率的视频(8x224x224);以及一个介于两者之间的(16x112x112)。 尽管有三个数据流需要处理的信息显然更多,但由于采用了迭代共同标记方法,获得了非常高效的模型。同时,这些额外的数据流允许提取最相关的信息。 例如,如下图所示,与特定活动相关的问题在分辨率较低但帧率较高的视频输入中会产生较高的激活,而与一般活动相关的问题可以从帧数很少的高分辨率输入中得到答案。 这种算法的另一个好处是,标记化会根据所问问题的不同而改变。

结论

研究人员提出了一种新的视频语言学习方法,它侧重于跨视频-文本模式的联合学习。 研究人员解决了视频问题回答这一重要而具有挑战性的任务。 研究人员的方法既高效又准确,尽管效率更高,但却优于目前最先进的模型。

谷歌研究人员的方法模型规模适度,可以通过更大的模型和数据获得进一步的性能改进。研究人员希望,这项工作能引发视觉语言学习方面的更多研究,以实现与基于视觉的媒体的更多无缝互动。

99科技网:http://www.99it.com.cn

相关推荐
上市即巅峰!连年亏损、竞争加剧,格灵深瞳难破盈利困局 上市即巅峰!连年亏损、竞争加剧,格灵深瞳难破盈利困局

在过去几年中,在人工智能风口下,涌现出无数AI独角兽,商汤、旷视、云从、

快资讯2022-09-15

谷歌用新AI超越自己:让Imagen能够指定生成对象,风格还能随意转换 谷歌用新AI超越自己:让Imagen能够指定生成对象,风格还能随意转换

给Imagen加上“指哪打哪”的能力,会变得有多强?

快资讯2022-09-15

斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登Nature子刊:实现可信AI,数据的设计、完善、评估是关键

在当前 AI 模型的开发以模型为中心转向以数据为中心的趋势下,数据的质量变

快资讯2022-09-15

斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键 斯坦福李飞飞团队新研究登 Nature 子刊:实现可信 AI,数据的设计、完善、评估是关键

数据的设计、完善、评估三大步骤是关键。

快资讯2022-09-15

流血、止血、再造血,AI独角兽们何时涅槃? 流血、止血、再造血,AI独角兽们何时涅槃?

资本市场对它们的期待值并不算高,叠加业内竞争的加剧,各个AI公司的生存处

快资讯2022-09-15

MIT用GPT-3冒充哲学家,竟骗过了一大半专家 MIT用GPT-3冒充哲学家,竟骗过了一大半专家

Daniel Dennett是一位哲学家,最近他有了一个「AI替身」。

快资讯2022-09-15

岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想 岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想

特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创

快资讯2022-09-15

鹭岛金服平台案件新进展:新增7万回款、新冻结资金30万 鹭岛金服平台案件新进展:新增7万回款、新冻结资金30万

鹭岛金服 鹭岛金服清退回款官方指定网址【www.qdg18.cc】,官方指定QQ群【662-0

快资讯2022-09-14

来鑫财富最新清退消息2022:新通知来了、回款有希望官方保障清退顺利进行、兑付唯一渠道即将开启 来鑫财富最新清退消息2022:新通知来了、回款有希望官方保障清退顺利进行、兑付唯一渠道即将开启

来鑫财富 来鑫财富清退回款官方指定网址【www.qdg18.cc】,官方指定QQ群【662-0

快资讯2022-09-14

成功的定位要做什么?定位专家顾均辉:以云澜湾、雄正为例 成功的定位要做什么?定位专家顾均辉:以云澜湾、雄正为例

企业定位主要有三大方法:抢先定位、关联定位和重新定位,每种方法适用的企

快资讯2022-09-13