一个AI绘画的小进展

2022-09-22 14:09

各位AI绘画爱好者，尤其是Stable Diffusion的用户，晚上好。

这里我要向大家通报一个新进展，前情如下：

在实践过程中，我们经常遇见一类相同的困境---发现一张AI作品不错，自己也想画一张类似的东西出来，但是对方没有提供Prompt。很正常，因为目前的AI绘画都是文本生成图片，最珍贵的部分莫过于Prompt，所以别人不分享也没有什么奇怪的。但是，那种抓耳挠腮，欲求而不得的痛苦却让人印象深刻。

最近，我的朋友霍炬利用现有的各种开源软件和库，尝试开发了一个新功能，叫做!Guess，当你向他的服务器发送一张图片之后，算法会反向解析图片，分析画面的风格和艺术家，然后给出一个对应的Prompt。

今天的题图是一张我在网上找到的网图，姑且就叫做猫头灯吧。我看后很喜欢，想要也生成一张类似的图片。于是我就用!guess反向解析了一番。它给出了风格分析：

Medium: an art deco sculpture (74.3%)

Artist:by Weiwei (4.7%)

Trending:featured on cg society (24.8%)

Movement:cloisonnism (83.9%)

Flavors:art deco (21.8%)

made of crystals (10.0%)

high detail (4.1%)

随后，它也给出了Prompt建议：

a cat shaped lamp with a cat's face on it an art deco sculpture by Weiwei, featured on cg society, cloisonnism, art deco, made of crystals, high detail.

根据建议，我新增了一点修改：light effect，然后我就看到了以下的成果：

其实我相当满意，因为我不单得到了类似的结果，而且AI还给我提供了更多种可能。跳开找图这一点来看，AI其实在帮我设计了一堆猫头灯和猫咪灯。

当然这里是个比较理想的例子，我甚至找到了和原图高度类似的图片。自己人不骗自己人，我们都很清楚，为了得到一张满意的图片，之前我们得放弃掉多少张不那么完美的图片。所以，我也想给大家一点不那么精确的例子，那才是AI绘画的常态。我们先看原图：

然后看!guess反向解析生成的图片：

差异化很大对吧？反向解析的库现在没那么大，因此解析结果也就没有那么精准。但是，请允许我说一声“但是”，但是我还挺喜欢反向解析之后生成的这些图，觉得也有另外一种风格。重点在于，一旦我得到了Prompt，那么就等于是我学会了画这种画风，不是么？

我认为让人们手工去写Prompt还是门槛太高，尤其是对于毫无美术经验的素人而言。即便把AI当做是工具发给他们，他们也未必能够立即生成自己满意的图片。因此，在理想状况下的AI绘画玩法，应该是人们先有了一张自己喜欢的图片，爱得不行，然后扔给AI反向解析。然后人们根据解析结果，直接使用Prompt去生成，因为有Seed的摆动，加上-n的存在，那么可以立即尝试出一批结果来，其中也许就有他们喜欢的图片。只要喜欢，是不是一开始他们想要的那种风格和构图，可能这时候也已经变得不重要了。

!guess是个小进展，通报给大家是想让大家知道AI绘画的可能性又多了一种。同时，也想以这篇文章作为一种鼓励和敦促，希望霍炬能早日测试调试完毕上线，给Stable Diffusion的世界增加一种新的玩法。

最后，霍炬也希望我能够分享他的开源项目地址。如果有人喜欢这个功能，想要自建服务，运行Bot，请点击访问文末“阅读原文”链接，前往霍炬的GitHub项目页面。

槽边往事和菜头出品

【微信号】Bitsea

个人转载内容至朋友圈和群聊天，无需特别申请版权许可。

请你相信我，

我所说的每一句话，

话都是错的

禅定时刻

《青稞绿时》

和菜头的小肉手

Stable Diffusion

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章