大红大紫的扩散模型，真就比GAN强吗？

2023-03-22 08:03

AI绘画属于AIGC分支之一，在热潮与争议之中，2022年甚至被冠以“AIGC元年”。而随着AI 绘画的火爆，其背后用到的核心技术之一 Diffusion Model（扩散模型）也在图像生成领域大红大紫，甚至风头已经隐隐有开始超过 GAN 的趋势了。

从原理图可以看出，输入的文本首先经过编码，再由一个文字转图像的扩散模型转化为64*64的小图，从而利用超分辨率扩散模型对小图进行处理，在进一步的迭代过程中提升图像的分辨率，得到最后的生成结果——一张1024*1024的最终图像。

扫码领diffusion必读论文

预约扩散模型大咖直播课

Diffusion model 借助图像分割领域的UNet，训练loss稳定，数据足够，模型效果非常好。相比于GAN需要和判别器对抗训练或者VAE需要变分后验，diffusion model的loss真的是太简单了。diffusion model只需要“模仿”一个非常简单的前向过程对应的逆过程即可。这样简单高效的训练也使得diffusion model在许多任务中的表现都非常好，甚至超过了GAN。

整体上来看，diffusion model领域正处于一个百花齐放的状态，这个领域有一点像GAN刚提出来的时候，但目前的训练技术让diffusion model直接跨越了GAN领域调模型的阶段，而是直接可以用来做下游任务。这个领域有一些核心的理论问题还需要研究，这就给科研从业者提供个很有价值的研究内容，有很多idea都可以被激发出来，同时由于这个模型已经很work了，它和下游任务的结合也才刚刚起步，有很多地方都可以赶紧占坑。而未来随着diffusion model中存在的问题的解决，diffusion model将逐渐占据深度生成模型的主导。

最近在和一位毕业于清华大学的顶会论文大佬聊天的过程中，被他的背景惊到了，这位大神，目前已经发了二十多篇顶会论文！（绝对算是顶会论文收割机级别了）除了是CVPR、ECCV、ICCV、AAAI、ACM、MM、IJCV等顶级会议和期刊审稿人之外，他还是阿里资深研究科学家，这些描述每一个都不简单~

3月29日，也邀请了这位顶会论文大佬，来和大家聊一聊扩散模型原理及其在跨模态合成应用，来看看大佬是怎么理解目前大火的扩散模型的～

扫码免费预约顶会大佬直播课

限前一百名粉丝

文末领福利