Redian新闻
>
不用 20 张图!一张图就能生成 AI 头像,这个来自中国团队的项目太好用了

不用 20 张图!一张图就能生成 AI 头像,这个来自中国团队的项目太好用了

公众号新闻

前两天,一个来自小红书的大佬发了个新项目——InstantID,是用一张你的随意角度的照片,就能生成一个 AI 头像。
比如这样:
它的使用非常简单,打开 Hugging Face 上的 Demo 页面:
https://huggingface.co/spaces/InstantX/InstantID
然后上传一张图片、写或者不写 prompt都可以、点击 Submit 等待 30 秒左右就可以拿到图片了。
在不了解技术细节的初体验下,方便、快速、效果好是第一印象。不需要像之前的同类产品那样,需要特定角度的照片或者是很多张照片,一张足矣。
这个项目说是 AI 个性化图片生成领域的重磅炸弹显得有点一惊一乍的,毕竟现在 AI 界每天值得“震撼”的新闻太多了。
但 InstantID 这个项目在 X 上,一众大佬都关注到了这款产品,比如Yann LeCun:
Yann LeCun想要一个钢铁侠的衣服,于是这个项目的作者亲自下场,做了一组漫威LeCun宇宙:
据InstantX Team表示,他们采用的即插即用(plug-and-play)模块只需使用单张面部图像就能处理各种风格的图像个性化工作,同时确保人物面部的高保真效果。几位团队成员都亲自下场做了一系列自己的 AI 头像:
和其他同类型的产品相比,InstantID有几点不同:
首先,InstantID不训练 UNet,因此可以保留原始文本到图像模型的生成能力,并与社区中现有的预训练模型和 ControlNets 兼容;其次,InstantID不需要在测试时进行调整,因此对于特定的字符,不需要收集多张图像进行微调,只需要推断一次单一图像。而且在实际应用中不难发现,InstantID实现了更好的人脸保真度,并保留了文本的可编辑性。
通过风格的选择,可以用一张图实现多个风格的变换。
除了出色的一致性之外,还可通过提示词进行二次加工,同时也展现了与现有 ControlNet的兼容性。
在有多张参考图像的前提下,会取 ID 嵌入的平均值作为图像提示。其实一张图的时候效果就已经很不错了。
在官方的 Paper 中,还探讨了几个有趣的使用案例。其中包括视图合成,InstantID 可以在保持角色一致性的同时创建新的视角和角度。比如创建一张 20% 泰勒斯威夫特和 80%杨幂长相的图片。
以及 InstantID 无缝融合多种身份特征的能力,能管理涉及多个角色的复杂场景。这些应用都展现了 InstantID 在各种创意和实际环境中的多功能性和有效性。比如像是人类与萌宠相结合:
在论文中还有一些跟过去原有技术的对比,感兴趣的可以直接在官方页面查看:
https://instantid.github.io/
目前可以查到的,InstantX Team的主要成员之一王浩帆,是一名来自小红书的研究工程师(research engineer),主页链接:
https://haofanwang.github.io/
之后我们会持续关注InstantX Team这个团队的进展,也会有更多这样的新项目分享给大家,有好的项目也欢迎各位向我们安利。


欢迎加入这个星球,见证硅基时代发展↓


点个在看,再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
澳洲每周近80名国际学生申请庇护!来自中国的申请者最多洛杉矶查获逾140万支电子烟,来自中国中国团队,公开“大芯片”没得一个四川人,能忍到最后一张图!台湾大选与外省人情结AI头像火了,快来测测你的ai头像吧家居修理系列: 漏水篇(1)7B开源数学模型干翻千亿GPT-4,中国团队出品故事 I 亚裔少女带中国团队搞副业,月入$3.4万洛杉矶知名华人市长肝癌病逝!他是美国首位来自中国大陆民选官员武汉理工官建国团队Sci.Adv.:可注射纳米机器人载药靶向溶栓2023年冲出23家新晋AIGC独角兽:最高估值千亿,6家来自中国面朝大海,君临城下的魅力城市突发!上千走线客滞留南加州寒冷荒漠,缺衣少食!一半来自中国...室温超导有续集?中国团队再次证明LK-99可能存在迈斯纳效应,论文刚刚上传两百米爱情突发!上千非法移民滞留美国荒漠,缺衣少食!一半来自中国...《晴空月儿明》&合唱《约定》惊人:用AI大模型生成一张图,相当于给一部手机充满电抖音跳舞不用真人出镜,一张照片就能生成高质量视频!字节新技术连抱抱脸CTO都下场体验了纯手工、无添加的儿童早餐包,不用和面不用揉,味道和口感太好了头像|𝐒𝐡𝐚𝐫𝐞·招桃花头像跟着中国日报学英语,这个app太好用了!一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色10万商家倒闭,这个类目太坑了美国瑞典投入上亿元的项目,这个团队只花了220万元53岁韩国猛男一夜爆火,被中国网友捧为头像界顶流:太管用了!SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作“纹一个老大的头像,奖励一万元”|揭秘民资解冻骗局“96110”!华人看到这个来电请注意!骗子冒充“反诈中心”,华女被骗10万美元……一个技术窍门:如何识别人工智能生成的假图像世界首个!中国团队主导!半导体材料大突破超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能个人代理记账出事了!判刑+罚款!2024年起,代理记账必须按这个来,否则……
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。