国际科技财经博客移民网络热点娱乐民生时事公众号

>

免训练！单图秒级别生成AI写真，人像生成进入无需训练的单阶段时代

免训练！单图秒级别生成AI写真，人像生成进入无需训练的单阶段时代

2024-01-18 12:01

介绍

作为 AI 人像写真开源项目的佼佼者，FaceChain 凭借其丰富多样的风格模版和卓越的人像保真度，深受社区的喜爱并已在商业应用中得到了广泛的应用。近期，FaceChain 团队推出了全新的版本——FaceChain FACT。这一创新版本摒弃了传统的人物模型训练过程，能够直接生成 zero-shot 目标人像，引领 AI 人像生成进入了无需训练的单阶段时代。

你是否曾经因为相册里只有寥寥几张照片而无法训练自己的数字形象而感到苦恼？或者因为需要等待 20 分钟左右的人物形象训练而感到焦急？

目前市场上的 AI 写真大多采用“训练+生成”的两阶段模式，既需要庞大的形象数据支撑，也需要一定的训练时间。这种模式增加了用户的使用成本。面对这一问题，FaceChain 给出了解决方案：无需大量数据，无需训练等待，甚至无需训练，只需要一张图片 10 秒钟即可立即生成 AI 写真！

原理

FaceChain FACT（Face Adapter）之所以能够跳过训练阶段，是因为它经过了百万级别的写真数据训练，从而使得 Stable Diffusion 具备了强大的人脸重建能力。

与传统的双阶段人像生成方法不同，FaceChain FACT 重新构建了 Stable Diffusion 模型的架构，使其能够将人脸信息作为独立分枝的条件，平行于文本信息一起送入模型中进行推理。通过这种方式，FaceChain FACT 能够更高效地处理人脸重建任务，从而避免了繁琐的训练阶段。FACT 整个框架如下图所示：

为了更全面地提取人脸的细节信息，FACT 采用了在海量人脸数据上预训练的基于 Transformer 架构的人脸特征提取器。与 CNN 架构的特征不同，基于 Transformer 架构的特征能够更好的适应 Stable Diffusion 的结构。通过这种方式，FACT 能够更精确地保留人脸的细节特征，从而实现高清的人脸重建。

为了确保 Stable Diffusion 的原有功能得到充分保留，FACT 作为独立的 adapter 层被插入到原始 Stable Diffusion 的 block 中，并在训练时固定原始 block 参数，仅对 adapter 进行训练。

此外，人脸特征与文本特征是相互独立的，平行送入 block 中，避免了彼此之间的干扰。通过调整人脸信号的权重，用户可以灵活地调节生成效果，从而在保持 Stable Diffusion 原有的文生图功能的同时，平衡人脸的保真度与泛化性。

效果

在 FACT 的加持下，FaceChain 的人像生成体验又有了质的飞跃。

1. 在生成速度方面，FaceChain-FACT 成功摆脱了冗长繁琐的训练阶段，将定制人像的生成时间大幅缩短了百倍。现在，整个生成过程仅需 10s 左右，为用户带来了无比流畅的使用体验。

2. 在生成效果方面，FaceChain-FACT 成功提升了人脸的细腻程度，使其更加逼近真实的人像效果。通过高度保留的人脸细节信息，确保了生成写真效果既惊艳又自然。FaceChain 海量的精美风格模版，又为生成的人像注入了艺术生命力。

FaceChain-FACT 的诞生，将为用户开启前所未有的高质量 AI 写真体验。除了在生成速度与质量上的显著提升，FaceChain 还提供丰富的 API 接口，让开发者可以根据自己的需求进行定制化开发。

无论是想要创建自己的 AI 写真应用，还是在现有项目中集成 FaceChain 的功能，都可以轻松实现。我们深知创新与定制化的重要性，因此我们将不断探索和加入新的风格模版，以及更多有趣的功能。我们热忱欢迎对开源技术感兴趣的朋友们加入我们，共同引领 AIGC 文生图领域迈向崭新的时代！

参考

项目主页：

https://facechain-fact.github.io/

Github项目：

https://github.com/modelscope/facechain

钉钉用户群：

钉钉开发群：

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：[email protected]

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

伙计干得不错，只是太晚太弱了点。。。。《纽约时报》插画师上线了世界第一款“人脑驱动”图像生成器～斯里兰卡｜独立日庆典游行排练，下周封路路段时段请注意！同样是30岁，为什么有人像18岁，有人像50岁几何纹理重建新SOTA！浙大提出SIFU：单图即可重建高质量3D人体模型谷歌新作UFOGen：通过扩散GAN实现大规模文本到图像生成 AI 也会戴有色眼镜？一文揭露图像生成中的刻板印象《歌德堡变奏曲1469》最新综述！3D生成进展的全面调研现在的大学生也太卷了吧！用D5+AI渲染，出图秒杀设计院！\'Red Rose of Normandy\' by Tino Struckmann 鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞 | 可免费体验 ControlNet作者又出新作：百万数据训练，AI图像生成迎来图层设计 Midjourney V6超进化，大神网友深度评测来了！画质逼真到可怕，人像图片令人惊呆正式确诊为“burnout”？网友：每隔一段时间就崩溃一次 AI早知道｜Stability AI正在考虑出售；魅族发布智能助手Aicy；亚马逊发布Titan图像生成器 Meta清华校友推全新AI「视频生视频」方法！单张A100生成「男人秒变猩猩」大片周小平：中缅口岸一带一路物流中心遇袭，南战区启动演练！克钦武装和彭家同盟军露出真实嘴脸葡萄牙金乔海滩(Guincho beach)，景点打卡得了肾结石千万别生扛，当心拖成“噶腰子”……警察有级别吗？一级高级警长相当于什么级别？无需训练实现价值观实时动态对齐：上交开源价值观对齐方法，闭源与开源大模型均适用用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用美国报税是否要求本人年度必须在美国居住过一段时间？｜移投路群问答无需额外知识或训练！中科大等提出OPERA：缓解多模态大模型幻觉问题的基于注意力惩罚与回退策略的解码方法长篇小说连载《此世，此生》第五十六章三【国际】日媒：若富士山喷发日本首都圈六成居民将陷入无物资困境产品对比 | 一张图秒懂功率王X100与写趣CX100！无需训练实现价值观实时动态对齐：上交开源价值观对齐方法OPO，闭源与开源大模型均适用前段时间刷屏的秘鲁外星人鉴定出来了！果然…哈哈哈 WPS承诺用户文档不会被用于AI训练！隐私政策为何要写“脱敏后作为AI训练”？用训练铸就善因｜四、我们会成为我们所训练的样子看见这张图没有，你就照着画：谷歌图像生成AI掌握多模态指令微软推出订阅服务Copilot Pro；腾讯人像生成器PhotoMaker开源；阿里云起诉山寨通义千问一审胜诉丨AIGC大事日报 Yann LeCun发来肯定：腾讯人像照片生成可以随便玩了

热点事件追踪