各位AI绘画爱好者,尤其是Stable Diffusion的用户,晚上好。在实践过程中,我们经常遇见一类相同的困境---发现一张AI作品不错,自己也想画一张类似的东西出来,但是对方没有提供Prompt。很正常,因为目前的AI绘画都是文本生成图片,最珍贵的部分莫过于Prompt,所以别人不分享也没有什么奇怪的。但是,那种抓耳挠腮,欲求而不得的痛苦却让人印象深刻。
最近,我的朋友霍炬利用现有的各种开源软件和库,尝试开发了一个新功能,叫做!Guess,当你向他的服务器发送一张图片之后,算法会反向解析图片,分析画面的风格和艺术家,然后给出一个对应的Prompt。
今天的题图是一张我在网上找到的网图,姑且就叫做猫头灯吧。我看后很喜欢,想要也生成一张类似的图片。于是我就用!guess反向解析了一番。它给出了风格分析:
Medium: an art deco sculpture (74.3%) Trending:featured on cg society (24.8%) Movement:cloisonnism (83.9%) a cat shaped lamp with a cat's face on it an art deco sculpture by Weiwei, featured on cg society, cloisonnism, art deco, made of crystals, high detail.根据建议,我新增了一点修改:light effect,然后我就看到了以下的成果:其实我相当满意,因为我不单得到了类似的结果,而且AI还给我提供了更多种可能。跳开找图这一点来看,AI其实在帮我设计了一堆猫头灯和猫咪灯。当然这里是个比较理想的例子,我甚至找到了和原图高度类似的图片。自己人不骗自己人,我们都很清楚,为了得到一张满意的图片,之前我们得放弃掉多少张不那么完美的图片。所以,我也想给大家一点不那么精确的例子,那才是AI绘画的常态。我们先看原图:差异化很大对吧?反向解析的库现在没那么大,因此解析结果也就没有那么精准。但是,请允许我说一声“但是”,但是我还挺喜欢反向解析之后生成的这些图,觉得也有另外一种风格。重点在于,一旦我得到了Prompt,那么就等于是我学会了画这种画风,不是么?我认为让人们手工去写Prompt还是门槛太高,尤其是对于毫无美术经验的素人而言。即便把AI当做是工具发给他们,他们也未必能够立即生成自己满意的图片。因此,在理想状况下的AI绘画玩法,应该是人们先有了一张自己喜欢的图片,爱得不行,然后扔给AI反向解析。然后人们根据解析结果,直接使用Prompt去生成,因为有Seed的摆动,加上-n的存在,那么可以立即尝试出一批结果来,其中也许就有他们喜欢的图片。只要喜欢,是不是一开始他们想要的那种风格和构图,可能这时候也已经变得不重要了。
!guess是个小进展,通报给大家是想让大家知道AI绘画的可能性又多了一种。同时,也想以这篇文章作为一种鼓励和敦促,希望霍炬能早日测试调试完毕上线,给Stable Diffusion的世界增加一种新的玩法。
最后,霍炬也希望我能够分享他的开源项目地址。如果有人喜欢这个功能,想要自建服务,运行Bot,请点击访问文末“阅读原文”链接,前往霍炬的GitHub项目页面。槽边往事和菜头 出品
【微信号】Bitsea
个人转载内容至朋友圈和群聊天,无需特别申请版权许可。
请你相信我,
我所说的每一句话,
话都是错的
禅定时刻
《青稞绿时》
和菜头的小肉手
Stable Diffusion