Adobe推新Firefly Image 2，让小白也能用图生文软件

公众号新闻

2023-10-12 01:10

点击上方蓝色字体“腾讯创业” 选择关注公众号

创投圈大小事，你都能尽在掌握

腾讯创业 | ID：qqchuangye

“产品逻辑+入口把控=30亿次应用”

本文来源 “腾讯科技”（ID:qqtech），腾讯创业经授权后转载。

作者／郝博阳

当产品之王杀入AI战场时，它打算如何怎么教AI初创公司做ToC产品？

10月10日晚，在Adobe Max活动中，Adobe推出了Firefly Image 2模型。过往在使用图生文的软件，如Midjourney时，对用户最大的考验可能是语言能力——得掌握各种风格化的名称，用AI能理解的方式表述内容。这个过程本身已经形成了一种炼丹玄学，大大增加了一般用户的使用成本。写了个小作文，却生成不出自己想要的东西的痛苦，只有用功的才能体会。

现在，图像产品界的王者Adobe给这些前辈新学们上了一课，在他们还在从底层逻辑上研究如何用AI自进化提示的方式减少提示成本时，直接用产品优化的逻辑去填上提示工程与用户的沟壑。

硬实力升级不能少

基础能力方面Firefly Image 2追上了时代主流。相对一代，它增加了模型容量，与原始模型相比，它显著提高了图像生成质量和速度。尤其是在渲染真实感人类时，在树叶、皮肤纹理、头发、手和面部特征等高频细节方面。使用Firfly Image 2模型生成的图像具有更高的分辨率，并且具有更生动的颜色和颜色对比度。而且在软件中，用户可以在Firfly应用中对比一二两代的生成结果，提升还是肉眼可见的。

横向比较，从生成的图像效果来看，Firefly2与目前市场中的主要最新竞品Midjouerney v5.2和Dalle3对比起来，在细节程度上基本在同一水平层。

软实力升级才是主菜

丨提示建议功能

提示词建议这个功能并不新，Google、微软都已经在AI对话应用上使了一阵子了。但Firfly Image 2是它在图生文产品中的初次亮相。靠着AI的提示，就算只通过几个简单的单词，Firfly也能可以帮助自动完成提示，以生成用户目标的内容。

不仅如此，提示建议功能还可以基于用户的提示词拓展提示，让图像朝着不同的创意方向发展。这简直是文字表达能力匮乏者的福音！但悲报是仅限英语。

而且从底层上，Firefly Image 2对文本提示有更好地理解，可以识别更多的地标和文化符号。用户说东，它理解西的可能性也大幅减小。但具体的效果和原理Adobe并未过多解释，还要等白皮书发布后才能一探究竟。

通过这个产品功能，用户表达与AI理解间的鸿沟在很大限度上被缩小了。

丨生成匹配（Generative Match）

这是Firfly业界首创的功能，直指解决风格化提示词过于复杂的问题。风格化的词记不住，不会表达，那就直接用图示告诉你。用户可以从Adobe自己精选的风格列表中选择喜欢的风格，或者干脆上传自己的参考图像，以指导通过Firefly Web应用中的文本到图像提示生成新图像的风格。而且这也可以帮助提升一组图片的风格一致性。对用户来讲，风格这东西，看图比看字容易理解多了。

靠着这个功能，一般用户想固定生成图像风格化的问题基本可以说被解决了。

丨照片设置（Photo Settings）

生成出来的图大概满意，但还想微调怎么办？Firefly Image 2可以使用“照片设置”进行更具创造性的控制，并能够调整生成照片的设置。用户可以像更改真实相机照片一样更改照片参数：光圈、快门速度和视野。就类似于苹果在IOS17新推出的AI图片处理能力。

此外，针对那些生成图片里多出来的不想要的元素，用户可以在Firefly中使用负面提示可删除掉。比如特定的颜色、形状等内容。最多可以输入100个单词让用户从生成的图像中做减法。

在精修层面，虽然现在有很多其他的AI工具提供了局部精修和局部重新生成的能力，但他们或者操作很不友好，或者需时很长，这对于一般非专业用户来讲都过于不友好。Adobe在这个层面算是有所取舍，在通过前两个功能升级，保证生成图像的主体大概准确的前提下，选择了两种低成本，易理解的功能来保证用户友好的前提下的图像修改能力。

拓展AIGC边界

除了Image2带来的用户易用性大量更新外，Adobe还为试图把AIGC的功能带向其旗下的所有产品。这毫无疑问会在设计界带来新的波澜。因为与一般的文生图软件所带来的JPEG文件相比，设计师们更多的是在用这些软件做着设计和修改的专业工作。

Adobe Illustrator推出了一个新的Firefly矢量模型。他们声称这是“世界上第一个矢量图形的生成人工智能模型”。与传统的JPEG和PNG文件不同，矢量图形（也称为SVG文件）非常适合LOGO设计师等创意人员，因为它们可以缩放到任何大小，而不会影响整体图像质量。和Image一样，用户可以使用文本提示创建可编辑的矢量图像，而且AI还会自动将图形的每个元素划分为“逻辑”组和层。

另外，Adobe还推出了Firefly Design模型，该模型可为打印、社交帖子、在线广告、视频等生成可定制的模板。Adobe的Firefly Design模型为Adobe Express中新的文本到模板测试版功能提供了动力，它使用文本提示为“所有流行的纵横比”生成完全可编辑的模板。“它与Canva的Magic Design功能（另一个与Adobe Express竞争的一体化设计平台）有一些相似之处，用户可以描述类似于“海滩度假传单”的东西来生成独特的模板，而不是将原来一样，把一个个个单独的文本和图像拖放在空白画布上。

产品逻辑+入口把控=30亿次应用

据Adobe称，Firefly这个之前在AI文生图圈中并不非常流行的软件，迄今已用于生成超过30亿张图像。这也许是因为AI爱好者都在玩Midjourney，但设计师们真正去用的还是Adobe。这也说明了拥有着最多设计专业用户的Adobe软件有着其他新兴应用难以比拟的入口优势。

在这一年内，Canva和微软等其他公司已经发布了各种人工智能驱动的创意工具。在这种紧迫感的驱使下，Firefly新版本已经把这个软件从一个看起来小打小闹的辅助工具带向了行业前沿水平。而且通过这次更新，Adobe明显找到了自己更熟悉的路径：用户需求驱动的产品逻辑。

END

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章