Redian新闻
>
文末福利 | 风靡朋友圈的妙鸭相机,到底用了哪些底层技术?

文末福利 | 风靡朋友圈的妙鸭相机,到底用了哪些底层技术?

公众号新闻

不知道大家近期的朋友圈有没有被和海马体、天真蓝如出一辙的AI写真刷屏!

这些面若桃花、精致到头发丝、光影充满氛围感的写真都是一款叫一款叫“妙鸭相机”的小程序生成的!只要9.9,就能体验999写真!

虽然只要9.9,但生成的照片真的很逼真!

在大家被ChatGPT和Midjourney所惊艳之后,如今又惊叹于妙鸭相机的写真能力!

它到底用到了什么AI技术才做到这么厉害的呢?

本文就带大家来探索一下!


01

AIGC关键技术

无论是ChatGPT,还是Midjourney、妙鸭相机,都属于人工智能创造内容(AI Generated Content,AIGC)!

AIGC有两项关键技术:

  • 一个是ChatGPT所代表的大模型(Large Language Model,LLM)技术

  • 另一个是Midjourney、妙鸭相机等AI绘画作图背后的扩散模型(Diffusion Model)技术

AI绘画、AI对话、AI游戏创作等这些产物的背后是深度生成模型,它可以根据已有的数据和计算机程序生成新的数据。

真实世界的数据是复杂的,其维度高、分布复杂,变量之间还存在非线性关系,例如,图片数据被认为是二维空间的像素点数据,并且图片内容决定了像素点之间有着复杂的交互关系。这对使用传统模型进行拟合数据分布提出了巨大挑战。

此外,我们不仅希望AI生成的内容有真实性,也希望其是新颖的,即可以对问题提出新的解决方案,而不只是复制已有的内容;高效地利用计算机的运算能力,实现高效的自动化生产;根据用户需求提供相应的内容,等等。

在这些需求下,扩散模型能够捕捉复杂的数据分布、产生真实、新颖的内容,并且能够实现个性化的、高效的生产。因此,引起了人们的广泛关注。

深度生成模型源于生成式建模和深度学习。

生成建模认为数据在相应的空间存在着概率密度分布,其目的就是建模和学习这种潜在分布。早期的生成建模如高斯混合模型(GMM),隐马尔可夫模型(HMM)在表达能力和可扩展性方面存在局限性,在现实数据的复杂性面前表现得较为吃力。

随后生成建模成功地与深度学习结合,产生了著名的变分自编码器(VAE)、生成对抗网络(GAN),等等。

  • VAE将深度神经网络与变分推断技术相结合,学习潜在先验并生成新样本。它们提供了端到端训练的框架,并提供了更灵活的生成建模能力。

  • GAN在深度生成模型的历史中是另一个重要的里程碑,GAN引入了一种新颖的对抗训练方法,同时训练生成器网络和判别器网络。该架构通过生成器和判别器网络之间的最小、最大博弈来生成高度逼真的样本。

深度生成模型还有基于能量的模型和基于流的模型,等等。


02

扩散模型

扩散模型于2020年被提出,但其发源可以追溯到2015年,理论背景甚至可以追溯到20世纪对于随机过程、随机微分方程的研究。

扩散模型通过向原始数据逐步加入噪声来破坏原始信息,然后再逆转这一过程生成样本。相较于以往的深度生成模型,扩散模型生成的数据质量更高、多样性更强,并且扩散模型的结构也很灵活,这使得扩散模型很快成为了研究和应用的热点。在《扩散模型:生成式AI模型的理论、应用与代码实践》一书中就详细讨论了扩散模型与其他深度生成模型的关系。


我们可以考虑一个物理过程来通俗地理解扩散模型。把真实世界的数据比作空气中的一团分子,它们互相交织,形成了具有特定结构的整体。由于这个分子团过于复杂,我们无法直接了解其结构,但我们可以理解在空气中做无规则运动的某种粒子,即对应着服从标准高斯分布的某个变量。从无规则运动的粒子出发,我们不断变换这些粒子的相对位置,每次只变换一小步,最终将这些粒子的分布状态变换为我们想要的复杂的分子的形态。也就是说,从纯噪声开始,我们进行了很多小的“去噪”变换,逐渐地将噪声的分布转换为数据的分布,这样就可以利用得到的数据分布进行采样,得到新的数据。可以看到,我们需要知道的信息就是——该如何进行每一步的变换。这比直接学习原始数据的分布简单得多,并且朴素地解释了扩散模型的有效性。《扩散模型:生成式AI模型的理论、应用与代码实践》一书会详细、严格地介绍扩散模型的原理和算法。

扩散模型也有其内在的缺点,如采样速度慢、对结构化数据处理能力较差,等等。例如,扩散模型在将噪声分布逐步转换为数据分布的过程中需要大量调用神经网络,这就导致了生成高质量图片时采样时间较长。后续大量的研究就是致力于提升扩散模型各个方面的性能,使扩散模型可以真正帮助人们高效解决现实问题。《扩散模型:生成式AI模型的理论、应用与代码实践》书将详细分析扩散模型的优缺点,并系统地讲解扩散模型的进一步发展。


03

扩散模型应用

得益于扩散模型的强大性能,图片生成的应用Stable Diffusion、DALLE·2、Midjourney、妙鸭相机等在实际生产中都有利用扩散模型进行创造性内容生成。

这些应用程序利用扩散模型进行条件生成,即基于输入,引导、生成符合条件的内容。这种引导可以是自然语句,可以是部分图像,也可以用低分辨率的图像作为引导,生成高分辨率的图像,等等。

此外还有利用扩散模型生成语音、视频等各种模态数据的应用。艺术创作者们可以使用这些应用进行直接创作,或者使用它来提供灵感。在生成内容上进行修改可以大大提升工作效率。

但同时,扩散模型的强大能力和广泛引用也导致了潜在的负面影响。

  • AI的高效让部分创作者面临失业的风险;

  • 扩散模型生成的内容存在版权问题、隐私问题和偏见问题;

  • AI生成的内容可能被用于有害的用途;

  • ……

此外,扩散模型在科学研究领域也有应用,比如分子结构生成、分子动力学模拟。扩散模型可以生成表示分子的3D表示、分子的图结构,或者二者同时生成,以及控制生成分子的性质。这对于AI制药领域是又一大研究贡献。

在工业界的应用有点云生成和补全、异常检测等。

在医学领域的应用包括医学图像重建和病灶检测等。

总的来看,扩散模型在各个领域正处于一个百花齐放的状态。

《扩散模型:生成式AI模型的理论、应用与代码实践》书也会详细介绍扩散模型在各个领域的应用研究。

为了推进扩散模型的发展和应用,需要多个学科领域的合作,包括机器学习算法、深度生成学习理论、随机分析理论,各领域的应用研究、隐私保护、法律与监管要求等。

目前扩散模型在各领域的发展和应用的介绍分散于论文和网络上,因此有必要在《扩散模型:生成式AI模型的理论、应用与代码实践》这本书中进行系统地介绍。


《扩散模型 : 生成式AI模型的理论、应用与代码实践》是一本从浅入深、全面系统地介绍扩散模型的书籍,其具备丰富的实践案例,以及前沿视角,受到一众专家、学者的认可、推荐。


 


PaperWeekly携手博文视点送书啦!

在本文评论区留言+点赞

我们将随机抽取7位读者

包邮送出这本AIGC重磅新书

活动截止时间为8月9日 09:00

届时请留意后台消息



🔍

现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧


·
·
·
·
·



点击阅读原文,查看本书详情!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
test一夜爆火的妙鸭相机,营销好有心机!妙鸭相机回应退款争议,理想回应网传被远程锁车,高德国际图将于9月上线,苹果我的照片流服务正式关闭,这就是今天的其他大新闻!9.9元的妙鸭相机只是“昙花一现”?四问投资人你最关心的问题你的20张自拍,到底帮妙鸭相机赚了多少钱?开源本地化部署的「妙鸭相机」,真的要革了「海马体」们的命了?|手把手教你搭建「妙鸭相机」网红妙鸭相机不支持退款,上海消保委点名批评!D - Day 隨想胜利大会师 - 前奏阿里云开源「通义千问」大模型;马斯克:特斯拉有望年底实现完全自动驾驶;妙鸭相机上线 B 端工作站 | 极客早知道9.9元“妙鸭相机”刷屏,官方点名批评!起底背后公司……9块9的妙鸭相机拍出399的效果,AI会替代照相馆吗风靡朋友圈的妙鸭相机,到底用了哪些底层技术?突然爆火!数千人排队!妙鸭相机再掀AI热潮,能否“挑战”照相业?茅台大动作!超110亿产业发展基金落地;华为15亿成立地产公司?知情人士回应;妙鸭相机就“用户无法登录”致歉丨大公司动态大众 7 亿美元入股小鹏,合作 2 款纯电车;妙鸭相机遭上海消保委点名;韩国学者发现首个「室温常压超导体」 | 极客早知道腾讯辟谣进军房地产;大众7亿美元投资小鹏汽车;学而思否认大规模退费;妙鸭相机遭上海消保委点名;美联储宣布加息25个基点...体验了爆火的妙鸭相机,模特小姐姐直呼恐怖。9.9的妙鸭相机,成了AI大模型落地的排头兵爱,距离和美妙鸭相机96小时大出圈?AI爆红背后有套路|直播总结对话妙鸭相机产品负责人 | 9.9赚钱吗?为什么下一步上线ToB产品?安卓版ChatGPT上线;妙鸭相机回应涉嫌侵害用户权益;网易有道发布子曰大模型丨AIGC大事日报AI软件妙鸭相机回应“不退款”争议:照片生成即视作服务完成王健林转让北京万达投资49%股权;新款AI相机引争议,妙鸭相机致歉;特斯拉车贷放宽至7年;美国推出会呼吸会出汗的机器人丨邦早报花9.9买套AI写真,“妙鸭相机”正让海马体们失业美国提高了债务上限美债的危机就解除了吗?布林肯又要访华了?导演消失了!Midjourney+妙鸭相机+Gen2新玩法:10块钱创造马斯克宇宙,一键图生视频花9.9买套AI写真,「妙鸭相机」正让海马体们失业|智涌焦点海外版妙鸭相机,“像不像”不重要妙鸭相机火出圈!这些AI明星案例有没有明天!|直播预告妙呀!妙鸭相机走红,优酷打开AIGC财富密码?妙鸭相机走红,腾讯大腿拍肿鞭牛晚报:传蚂蚁集团计划重组以再次启动IPO;7月88款国产网络游戏获批;AI软件妙鸭相机回应争议大众7亿美元入股,小鹏汽车股价40分钟猛涨40%;妙鸭相机遭上海消保委点名;学而思否认大规模退费丨邦早报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。