主页 > 快资讯 > 正文

「扩散模型」首篇综述+论文分类汇总,谷歌&北大最新研究

2022-09-19 20:31来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

最近爆火的“ 扩散模型 (diffusion model)”首篇综述来了! 作为深度生成模型中新的 SOTA ,目前有关它的理论和实践还在“野蛮生长”阶段,缺乏系统性 的 回顾。 为了反映这一快速发展领域的进展,这篇综述从 扩散模型算法细化分类 、 和其他五大生成模型的关联 以及 在七大领域中的应用 等方面展开,最后提出了扩散模型的现有 局限性 和未来的 发展方向 。 作者是来自加州大学&Google Research的Ming-Hsuan Yang、北京大学崔斌实验室以及CMU、UCLA、蒙特利尔Mila研究院等众研究团队。 第一作者杨灵,是来自北京大学的博士。 有看过的专业人士就表示:很多被引用的论文都是2022年的,可见跟踪SOTA是多么困难,以及这些调查是多么重要。 值得一提的是,作者还公开了本综述扩散模型论文分类汇总GitHub链接。 (附在文末~) 话不多说,让我们赶紧来深入了解一下吧。

一、介绍

扩散模型 (diffusion models) 是深度生成模型中新的SOTA。 扩散模型在图片生成任务中超越了原SOTA:GAN,并且在诸多应用领域都有出色的表现,如计算机视觉,NLP、波形信号处理、多模态建模、分子图建模、时间序列建模、对抗性净化等。 此外,扩散模型与其他研究领域有着密切的联系,如稳健学习、表示学习、强化学习。 然而,原始的扩散模型也有缺点,它的采样速度慢,通常需要数千个评估步骤才能抽取一个样本;它的最大似然估计无法和基于似然的模型相比;它泛化到各种数据类型的能力较差。 如今很多研究已经从实际应用的角度解决上述限制做出了许多努力,或从理论角度对模型能力进行了分析。但是,现在仍缺乏对扩散模型从算法到应用的最新进展的系统回顾。 为了反映这一快速发展领域的进展,我们对扩散模型进行了 首个全面综述 。我们设想我们的工作将阐明扩散模型的设计考虑和先进方法,展示其在不同领域的应用,并指出未来的研究方向。 此综述的概要如下图所示: 尽管diffusion model在各类任务中都有着优秀的表现,它仍还有自己的缺点,并有诸多研究对diffusion model进行了改善。 为了系统地阐明diffusion model的研究进展,我们总结了原始扩散模型的三个主要缺点,采样速度慢,最大化似然差、数据泛化能力弱,并提出将的diffusion models改进研究分为对应的三类: 采样速度提升 、 最大似然增强 和 数据泛化增强 。 我们首先说明改善的动机,再根据方法的特性将每个改进方向的研究进一步细化分类,从而清楚地展现方法之间的联系与区别。 在此我们仅选取部分重要方法为例,我们的工作中对每类方法都做了详细的介绍,内容如图所示: 在分析完三类扩散模型后,我们将介绍 其他的五种生成模型 GAN,VAE,Autoregressive model,Normalizing flow,Energy-based model。 考虑到扩散模型的优良性质,研究者们已经根据其特性将diffusion model与其他生成模型结合,所以为了进一步展现diffusion model 的特点和改进工作,我们详细地介绍了diffusion model和其他生成模型的结合的工作并阐明了在原始生成模型上的改进之处。 Diffusion model在诸多领域都有着优异的表现,并且考虑到不同领域的应用中diffusion model产生了不同的变形,我们系统地介绍了diffusion model的应用研究,其中包含如下领域:计算机视觉,NLP、波形信号处理、多模态建模、分子图建模、时间序列建模、对抗性净化。 对于每个任务,我们定义了该任务并介绍利用扩散模型处理任务的工作, 我们将本项工作的主要贡献总结如下 : 新的分类方法 :我们对扩散模型和其应用提出了一种新的、系统的分类法。具体的我们将模型分为三类:采样速度增强、最大似然估计增强、数据泛化增强。 进一步地,我们将扩散模型的应用分为七类:计算机视觉,NLP、波形信号处理、多模态建模、分子图建模、时间序列建模、对抗性净化。 全面的回顾 :我们首次全面地概述了现代扩散模型及其应用。我们展示了每种扩散模型的主要改进,和原始模型进行了必要的比较,并总结了相应的论文。 对于扩散模型的每种类型的应用,我们展示了扩散模型要解决的主要问题,并说明它们如何解决这些问题。 未来研究方向 :我们对未来研究提出了开放型问题,并对扩散模型在算法和应用方面的未来发展提供了一些建议。

99科技网:http://www.99it.com.cn

相关推荐
小叶子智能陪练宣布品牌升级「小叶子钢琴」 AI音乐生态再进阶 小叶子智能陪练宣布品牌升级「小叶子钢琴」 AI音乐生态再进阶

我们相信 AI 是一个值得深挖的技术,在未来的音乐学习领域,AI 还有很多拓展

快资讯2022-09-19

乐森机器人发布「巴斯光年」多感官交互娱乐机器人,由迪士尼/皮克斯正版授权 乐森机器人发布「巴斯光年」多感官交互娱乐机器人,由迪士尼/皮克斯正版授权

北京时间9月13日晚11点,消费级机器人品牌「ROBOSEN乐森机器人」(下简称:乐森)面

快资讯2022-09-19

「像航科技」获亿级A轮融资,以无介质全息技术深耕人机交互领域 「像航科技」获亿级A轮融资,以无介质全息技术深耕人机交互领域

近日,无介质全息产业龙头企业像航(上海)科技有限公司(以下简称「像航科

快资讯2022-09-19

EMQ 走进亚马逊云科技:携手云端,共筑「面向未来」的 IoT 基础设施底座 EMQ 走进亚马逊云科技:携手云端,共筑「面向未来」的 IoT 基础设施底座

近日,国内领先的开源物联网数据基础设施软件供应商 EMQ 映云科技(以下简称

快资讯2022-09-16

DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步 DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步

可解释性,已经成为当今机器学习研究与开发领域最紧迫的难题之一。

快资讯2022-09-15

谷歌、MIT「迭代共同认证」视频问答模型:SOTA性能,算力少用80% 谷歌、MIT「迭代共同认证」视频问答模型:SOTA性能,算力少用80%

谷歌、MIT联合研究,视频问答模型计算效率提升一倍。

快资讯2022-09-15

中国的人工智能研究有多强?一起来世界人工智能大会讨论大模型 中国的人工智能研究有多强?一起来世界人工智能大会讨论大模型

一种迈向通用人工智能的潜在路径正吸引越来越多的关注。

快资讯2022-09-15

一个模型搞定元素周期表常见元素:中国团队打造分子模拟预训练模型,最高节省90%数据 一个模型搞定元素周期表常见元素:中国团队打造分子模拟预训练模型,最高节省90%数据

DPA-1 ,中国团队深势科技以及北京科学智能研究院等机构打造,能覆盖元素周期

快资讯2022-09-15

Yann LeCun:大模型方向错了,智力无法接近人类 Yann LeCun:大模型方向错了,智力无法接近人类

你训练大模型用的是语言,还想获得 AGI?那肯定是永远也不行的。

快资讯2022-09-15

肉类加工行业服务商「Lumachain」宣布完成1950万美元A轮融资,专注于计算机视觉技术优化肉类工厂 肉类加工行业服务商「Lumachain」宣布完成1950万美元A轮融资,专注于计算机视觉技术优化肉类工厂

Lumachain的目标是帮助全球肉类行业实现创新, 解决包括劳动力短缺、通货膨胀

快资讯2022-09-15