Redian新闻
>
一周2.5k star,3张照片打造专属形象,开源项目FaceChain让每个人AIGC出个人写真

一周2.5k star,3张照片打造专属形象,开源项目FaceChain让每个人AIGC出个人写真

公众号新闻

机器之心报道

机器之心编辑部


最近,一些 AI 生成视觉形象的应用爆火,例如只需 9 块 9 就能生成个人写真的「妙鸭相机」。由于操作简单,不涉及任何技术操作,很多用户都纷纷在朋友圈晒出妙鸭相机生成的写真。


妙鸭相机虽然好用,但它是一个需要付费的应用。现在,一个名为 FaceChain 的开源项目可以用 AI 模型打造人物写真。项目上线一周,已经狂揽 2.5k star,今天还上了Github趋势排行榜第一名。



项目地址:https://github.com/modelscope/facechain


用户仅需提供最低三张照片,就可以获得特定风格的个人写真。例如,生成商务证件照:


也可以在 ModelScope 创空间中直接体验这项应用,无需任何安装步骤。



试玩地址:https://modelscope.cn/studios/CVstudio/cv_human_portrait/summary




作者在项目介绍中讲解了 AI 生成个人写真的技术原理,解释了生成式 AI 模型如何成为「写真神器」,我们来看下这部分讲解内容。


个人写真的生成原理


基本原理


AI 生成个人写真的能力来源于 Stable Diffusion 模型的文生图功能,—— 输入一段文本或一系列 prompt,输出对应的图像。而影响个人写真生成效果的因素主要有两方面:写真风格信息和用户人物信息。


为此,项目作者分别使用线下训练的风格 LoRA 模型和线上训练的人脸 LoRA 模型来学习上述两方面的信息。LoRA 是一种具有较少可训练参数的微调模型,在 Stable Diffusion 中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到 LoRA 模型中。


因此,个人写真模型的能力分为训练与推断两个阶段,训练阶段生成用于微调 Stable Diffusion 模型的图像与文本标签数据,得到人脸 LoRA 模型;推断阶段基于人脸 LoRA 模型和风格 LoRA 模型生成个人写真图像。


训练阶段


训练阶段的输入是用户上传的包含清晰人脸区域的图像,输出是人脸 LoRA 模型。


具体来说,项目作者首先使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法,来处理用户上传图像,得到包含正向人脸的图像;接下来使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,该项目使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后使用上述图像和标签数据微调 Stable Diffusion 模型得到人脸 LoRA 模型。


推断阶段


推断阶段的输入是训练阶段用户上传图像和预设的用于生成个人写真的输入 prompt,输出是个人写真图像。


在推断阶段,该项目首先将人脸 LoRA 模型和风格 LoRA 模型的权重融合到 Stable Diffusion 模型中;接下来使用 Stable Diffusion 模型的文生图功能,基于预设的 prompt 初步生成个人写真图像;随后,该项目使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中进行挑选;最后再使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。


项目作者已详细介绍安装与使用方法,并将项目代码开源,感兴趣的读者快去试试吧。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
他给女生照片打分,盗取信息,想复刻扎克伯克,但把自己送进去了Erklärung zur Zusammenarbeit让每个孩子从小自信、独立、乐观、优雅的成长指南!《玛蒂娜故事书》全新修订上市!唐三藏与马道婆三分钟教你如何用 Github 快速找到优秀的开源项目 !打造个人专属形象!工业级人物写真生成工具FaceChain开源七夕|穿对衣服不如戴对珠宝,让每个女人尖叫的礼物,它来了!小米向ASF捐赠 “三无” 开源项目,被怒批是闹剧我把这3张照片发在朋友圈,一分钟全是赞:出门这么穿,全世界独一无二!硬核观察 #1145 安卓 14 开源项目发布12306抢票的开源项目火了!31.7K Star带孩子回国的父亲小米一开源项目被批“三无”,项目导师回应《我的父亲是流亡学生》: 28. 浴火重生,七十周年6.7k Star量的vLLM出论文了,让每个人都能轻松快速低成本地部署LLM服务九年时间 倾情投入| JumpServer开源项目9周年致谢马哥教育!一张照片打脸无数健身男!“正经男人,谁去健身房?”有了ModelScope-Agent,小白也能打造专属智能体,附保姆级教程安达卢西亚的早春之行(一)前言越来越多开源项目停更,Java生态受影响最大美国SEC出台私募基金新规绿卡回美护航包:让每个客户安全回美!小米一开源项目被批“三无”,项目导师回应;Ruby on Rails之父将TypeScript从Turbo框架中移除 | Q资讯父亲与儿子的关系。。。推荐35款 SpringBoot/SpringCloud 开源项目,附源码GPT-3.5 Turbo支持微调了,打造专属ChatGPT,但价格小贵越来越多GitHub开源项目停更,Java生态受影响最大。网友:快没砖搬了!小白大挑战:24 小时内用 ChatGPT 和 Next.js 开发开源项目,吸引上万用户!利奥塔:让每个人都能成为自己的“异识”思路9.9体验999写真!AI写真走红,降维打击海马体?iPhone15没新意?VERTU新款「第二大脑」Web3手机,打造专属AI智能体阿里重磅开源FaceChain:让每个人AIGC出个人写真!650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目Meta花500万美元购买一明星形象,只为打造人工智能助理;中国网络空间安全协会人工智能安全治理专业委员会成立丨AIGC日报【2023坛庆】第八,九弹《Super Star》原唱 S.H.EOpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南Star Wars疑问,为什么Jedi武士只用激光剑不用激光枪?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。