主页 > 快资讯 > 正文

「扩散模型」首篇综述+论文分类汇总,谷歌&北大最新研究(4)

2022-09-19 20:31来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

六、和其他生成模型的联系

在下面的每个小节中,我们首先介绍其他五类重要的生成模型,并分析它们的优势和局限性。然后我们介绍了扩散模型是如何与它们联系起来的,并说明通过结合扩散模型来改进这些生成模型。 VAE,GAN,Autoregressive model, Normalizing flow, Energy-based model和扩散模型的联系如下图所示: 1、 DDPM可以视作层次马尔可夫VAE(hierarchical Markovian VAE)。但DDPM和一般的VAE也有区别。DDPM作为VAE,它的encoder和decoder都服从高斯分布、有马尔科夫行;其隐变量的维数和数据维数相同;decoder的所有层都共用一个神经网络。 2、DDPM可以帮助GAN解决训练不稳定的问题。因为数据是在高维空间中的低维流形中,所以GAN生成数据的分布和真实数据的分布重合度低,导致训练不稳定。扩散模型提供了一个系统地增加噪音的过程,通过扩散模型向生成的数据和真实数据添加噪音,然后将加入噪音的数据送入判别器,这样可以高效地解决GAN无法训练、训练不稳定的问题。 3、Normalizing flow通过双射函数将数据转换到先验分布,这样的作法限制了Normalizing flow的表达能力,导致应用效果较差。类比扩散模型向encoder中加入噪声,可以增加Normalizing flow的表达能力,而从另一个视角看,这样的做法是将扩散模型推广到前向过程也可学习的模型。 4、Autoregressive model在需要保证数据有一定的结构,这导致设计和参数化自回归模型非常困难。扩散模型的训练启发了自回归模型的训练,通过特定的训练方式避免了设计的困难。 5、Energy-based model直接对原始数据的分布建模,但直接建模导致学习和采样都比较困难。通过使用扩散恢复似然,模型可以先对样本加入微小的噪声,再从有略微噪声的样本分布来推断原始样本的分布,使的学习和采样过程更简单和稳定。

七、扩散模型的应用

在本节中,我们分别介绍了扩散模型在计算机视觉、自然语言处理、波形信号处理、多模态学习、分子图生成、时间序列以及对抗学习等七大应用方向中的应用,并对每类应用中的方法进行了细分并解析。例如在计算机视觉中可以用diffusion model进行图像补全修复(RePaint): 在多模态任务中可以用diffusion model进行文本到图像的生成(GLIDE): 还可以在分子图生成中用diffusion model进行药物分子和蛋白质分子的生成(GeoDiff): 应用分类汇总见表:

八、未来研究方向 1、应用假设再检验。

我们需要检查我们在应用中普遍接受的假设。例如,实践中普遍认为扩散模型的前向过程会将数据转换为标准高斯分布,但事实并非如此,更多的前向扩散步骤会使最终的样本分布与标准高斯分布更接近,与采样过程一致;但更多的前向扩散步骤也会使估计分数函数更加困难。理论的条件很难获得,因此在实践中操作中会导致理论和实践的不匹配。我们应该意识到这种情况并设计适当的扩散模型。

99科技网:http://www.99it.com.cn

相关推荐
小叶子智能陪练宣布品牌升级「小叶子钢琴」 AI音乐生态再进阶 小叶子智能陪练宣布品牌升级「小叶子钢琴」 AI音乐生态再进阶

我们相信 AI 是一个值得深挖的技术,在未来的音乐学习领域,AI 还有很多拓展

快资讯2022-09-19

乐森机器人发布「巴斯光年」多感官交互娱乐机器人,由迪士尼/皮克斯正版授权 乐森机器人发布「巴斯光年」多感官交互娱乐机器人,由迪士尼/皮克斯正版授权

北京时间9月13日晚11点,消费级机器人品牌「ROBOSEN乐森机器人」(下简称:乐森)面

快资讯2022-09-19

「像航科技」获亿级A轮融资,以无介质全息技术深耕人机交互领域 「像航科技」获亿级A轮融资,以无介质全息技术深耕人机交互领域

近日,无介质全息产业龙头企业像航(上海)科技有限公司(以下简称「像航科

快资讯2022-09-19

EMQ 走进亚马逊云科技:携手云端,共筑「面向未来」的 IoT 基础设施底座 EMQ 走进亚马逊云科技:携手云端,共筑「面向未来」的 IoT 基础设施底座

近日,国内领先的开源物联网数据基础设施软件供应商 EMQ 映云科技(以下简称

快资讯2022-09-16

DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步 DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步

可解释性,已经成为当今机器学习研究与开发领域最紧迫的难题之一。

快资讯2022-09-15

谷歌、MIT「迭代共同认证」视频问答模型:SOTA性能,算力少用80% 谷歌、MIT「迭代共同认证」视频问答模型:SOTA性能,算力少用80%

谷歌、MIT联合研究,视频问答模型计算效率提升一倍。

快资讯2022-09-15

中国的人工智能研究有多强?一起来世界人工智能大会讨论大模型 中国的人工智能研究有多强?一起来世界人工智能大会讨论大模型

一种迈向通用人工智能的潜在路径正吸引越来越多的关注。

快资讯2022-09-15

一个模型搞定元素周期表常见元素:中国团队打造分子模拟预训练模型,最高节省90%数据 一个模型搞定元素周期表常见元素:中国团队打造分子模拟预训练模型,最高节省90%数据

DPA-1 ,中国团队深势科技以及北京科学智能研究院等机构打造,能覆盖元素周期

快资讯2022-09-15

Yann LeCun:大模型方向错了,智力无法接近人类 Yann LeCun:大模型方向错了,智力无法接近人类

你训练大模型用的是语言,还想获得 AGI?那肯定是永远也不行的。

快资讯2022-09-15

肉类加工行业服务商「Lumachain」宣布完成1950万美元A轮融资,专注于计算机视觉技术优化肉类工厂 肉类加工行业服务商「Lumachain」宣布完成1950万美元A轮融资,专注于计算机视觉技术优化肉类工厂

Lumachain的目标是帮助全球肉类行业实现创新, 解决包括劳动力短缺、通货膨胀

快资讯2022-09-15