Redian新闻
>
聊聊大火的扩散模型和AIGC

聊聊大火的扩散模型和AIGC

公众号新闻

AI绘画属于AIGC分支之一,热潮与争议之中,2022年甚至冠以“AIGC元年”。而随着AI 绘的火,其背后用到的核心技术之一 Diffusion Model(扩散模型)在图像生成领域大红大紫,甚至风头已经隐隐有开始超过 GAN的趋势了 。

 

原理图可以看出,输入的文本首先经过编码,由一个文字转图像的扩散模型转化为64*64的小图,从而利用超分辨率扩散模型对小图进行处理,在进一步的迭代过程中提升图像的分辨率,得到最后的生成结果——一张1024*1024的最终图像。

 

扫码领diffusion必读论文

预约AIGC大咖公开课

Diffusion model最大的优势是训练简单。它借助图像分割领域的UNet,训练loss稳定,模型效果非常好。相比于GAN需要和判别器对抗训练或者VAE需要变分后验,diffusion model的loss真的是太简单了。diffusion model只需要“模仿”一个非常简单的前向过程对应的逆过程即可。这样简单高效的训练也使得diffusion model在许多任务中的表现都非常好,甚至超过了GAN。

整体上来看,diffusion model领域正处于一个百花齐放的状态,这个领域有一点像GAN刚提出来的时候,但目前的训练技术让diffusion model直接跨越了GAN领域调模型的阶段,而是直接可以用来做下游任务。这个领域有一些核心的理论问题还需要研究,这就给科研从业者提供个很有价值的研究内容,有很多idea都可以被激发出来,同时由于这个模型已经很work了,它和下游任务的结合也才刚刚起步,有很多地方都可以赶紧占坑。而未来随着diffusion model中存在的问题的解决,diffusion model将逐渐占据深度生成模型的主导。

3月8日,我们邀请顶会论文大佬、顶会审稿人Nick老师,来和大家聊一聊3D AIGC的方方面面,作为未来最有潜力,落地应用最广的研究方向之一,AIGC真的吸足了眼球,而Nick老师也将从AIGC出发,讲解它的落地场景,研究方向以及可能的创新点

扫码免费预约定顶会大佬直播课

限前一百名粉丝

文末领福利

要高效做科研掌握方法、合理利用自身可用资源很关键!结合身边学弟学妹以及自己的科研成长经历,发现大家普遍缺乏系统的科研知识体系,很难写出一篇合格的文章。更别提发现好的创新点和idea

做科研发论文从结果上,其实可以分为以下三类:

  1. 发现一个新方法,并将其运用在一个已知的问题之上(老问题新方法)

  2. 发现一个新问题,并将一个已知的研究拓展到这个问题之上(新问题老方法)

  3. 发现一个新问题,并且提出一个新方法用以对其进行分析研究(新问题新方法)

以难以程度来考量的话,新问题老方法<老问题新方法<新问题新方法。

所以,大家都头疼的创新点和idea,其实也有方法论,掌握了之后,就会比较容易找到一个idea~
想“idea”,有两宝——模型+算法
模型,可以理解成system model中的部分,可以是现有问题模型的拓展延伸,其实,这就叫创新,只要你做的是别人还没研究或者研究很少的,就已经可以算创新了。
当你提出了一个模型,就要选择一个合适的算法来解决模型中的问题。可以是寻找合适的算法根据自己的场景合理地进行改进,就已经是一个很棒的想法了。
对于科研新手来讲,如何踏出科研的第一步至关重要,确定一个研究方向,确定选题,然后找到创新点,获取idea,写出论文,这条打怪升级的道路,可以有简单模式,也可以有复杂模式,anyway,无论是哪种模式,有大神的指点都会轻松许多。
扫码免费预约定顶会大佬直播课

限前一百名粉丝

文末领福利

文末福利




作为日常为了论文而忙碌的科研人,小编知道大家一定很需要一些资料。因此,小编精心整理了一份超过1TAI顶会论文大礼包!包含最新顶会论文、书籍等资料,以及英文论文写作指导保姆级资料,从文献阅读到论文写作全部帮你整理好~


扫码免费领课程资料↑

-END-

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
玩不起RLHF?港科大开源高效对齐算法RAFT「木筏」,GPT扩散模型都能用​生成扩散模型漫谈:构建ODE的一般步骤(下)AIGC玩出新花样!Stable Diffusion公司提出基于扩散模型的视频合成新模型生成扩散模型漫谈:W距离 ≤ 得分匹配扩散模型这次杀疯了!第二次感染12秒内AI在手机上完成作画!谷歌提出扩散模型推理加速新方法谷歌下场优化扩散模型,三星手机运行Stable Diffusion,12秒内出图谷歌优化扩散模型!在三星手机上运行Stable Diffusion,12秒内出图!包邮送6本!NLP与ChatGPT的碰撞:大模型和小模型联合发力证件照转数字人只需几秒钟,微软实现首个3D扩散模型高质量生成效果,换装改形象一句话搞定 | CVPR 2023研究文革必先读邓《我的自述》终结扩散模型:OpenAI开源新模型代码,一步成图,1秒18张飞行看世界(1):ATL <-> SANCVPR 2023 | 微软提出LDGM:利用解耦扩散模型统一版面生成微软3D生成扩散模型RODIN,秒级定制3D数字化身浅聊大佬们的用人之道,懂的人机会翻一倍!ControlNet如何为扩散模型添加额外模态的引导信息?AI绘画侵权实锤!扩散模型可能记住你的照片,现有隐私保护方法全部失效7 Papers & Radios | 爆火论文打造《西部世界》雏形;OpenAI终结扩散模型聊聊大厂都在用的 JavaAgent图像生成终结扩散模型,OpenAI「一致性模型」加冕!GAN的速度一步生图,高达18FPS扩散模型这么强了?!速度惊人!手机跑Stable Diffusion,12秒出图,谷歌加速扩散模型破记录还不如GAN!谷歌、DeepMind等发文:扩散模型直接从训练集里「抄」物理改变图像生成:扩散模型启发于热力学,比它速度快10倍的挑战者来自电动力学开挖扩散模型小动作,生成图像几乎原版复制训练数据,隐私要暴露了ELITE项目原作解读:基于扩散模型的快速定制化图像生成新年,收25万美元大礼包扩散模型生成带汉字图像,一键输出表情包:OPPO等提出GlyphDraw聊聊几个含金量超高、即将大火的春季全美、全球大赛!DiffusionBERT项目原作解读:掩码预训练语言模型的扩散生成探索奥密克戎XBB.1.5在美国以每周翻一番的速度迅速成为主流变种大红大紫的扩散模型,真就比GAN强吗?GAN强势归来?英伟达耗费64个A100训练StyleGAN-T,优于扩散模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。