主流的性癖才是ai绘画的第一生产力
Blake是最早试图通过训练,让AI学会画人类双手的人。
早在去年十一月,他就兴奋地在社区上分享自己如何通过训练让Stable Diffusion 2.0画出自然完整的人类双手,他还分享了自己所使用的提示词prompt和训练的过程。
(滑动查看更多)
“ai不会画手“至今都被当做很多人类画师最后的壁垒,假如多几个AI绘画爱好者好好学习,这个难关可能四个月前就被攻克了。”
当时社区里点赞数最高的回复是这样的:
“Stable Diffusion 2.0可以画手。
但是Stable Diffusion 2.0不会拍片。
谁会需要一部由手出演的毛片呢?”
据统计,在90年代采样普及的时候,百分之九十的先锋音乐第一次拿到它都是先录一句“Fxxk”试试音,可能科技进步的内在已经变得越来越荒诞。
各种各样AI平台的开发商会告诉你限制AI技术发展的三大瓶颈是算力、算法和学习材料,但是在社区老哥眼里,技术宅的性癖才是未来决定了AI技术天花板的东西。
如果非要理性地讨论,我知道类似“手是人类身体结构最复杂的器官之一”、“ai无法通过二维的图片判断人体的骨骼结构”、“相比于它的复杂程度,手喂的太少了”这些都是有价值的结论。
为了搞明白这个问题,我也看了几篇天书一样的论文,直到我看到了这句话:
后来我想了想,可能手跟xx最大的共同特点是:对于技术宅来说,同属冷门性癖。
来自ai绘图论坛的meme
也许有成千上万个prompt(训练AI时所需要的提示词)去形容发色、服装、身材甚至更露骨的特点。但是真轮到冷门性癖的时候,尝试用ai去挑战科技极限的人们,那一瞬间的词穷,不禁让人想到那句哲学名言:“我语言的边界,就是我思想的边界。”
如果事情就这么野蛮生长下去,谁会关心手好不好看呢?大多数人玩这个都是为了取悦自己,手不好看就出一张没有手的图好了。
就像前几个月,我在推特看到一个骗子,他的头像和自拍全是用AI生成的。在他推文底下有这样一条评论“看这图是不是ai,你就看他图片里有没有手就好了。”
对于人类画师来说,“手”几乎成了约翰·康纳。
于是,当冷门性癖变成某种meme的时候,事情就发生了改变。
3月16日Midjouney发布了自己的V5版本,原本最大的亮点是它的渲染效果,几乎和照片一模一样。但是在媒体的添油加醋之中,全世界只记住了一个东西,“这次Ai学会画手了。”
不过据公路商店了解到的事实,这次在手的问题上,并没有质的飞跃,与其说是解决了画手的问题,更准确的说法是出现手的图片成图率更高了。“一共做了四张图片,还是有两张图片是不正常的,不过总比以前四张全不行要强”
其他的MidjourneyV5的渲染效果图
Ai攻克画手难题这个故事被讲述出来的时候,属于商业的部分总是会本能地放大;但是在另一方面,“社区的努力”在这种对比之中却被缩小了。没有人愿意去踩一捧一,只是我们在这里想要聊的是——那些来自于社区的努力几乎不会被人注意。
至少第一次,爱好者们看到画手难题的解决思路来自于社区。早在Midjouney5.0发布之前,越来越多的人已经把自己的注意力放在“手”上。
爱好者在社区分享的自己训练手部绘图能力时建立模型的过程,大多数人对这种思路表示认同“可能是建立手部模型时最好的解决方案”
开头Blake通过prompt训练的方式像是带着一个婴儿摇骰子,每一次结果都是随机的。现在社区里的努力,是要让它先熟悉一类手的动作。人们试图制作出善于描绘“手”形态的模型,但这是个漫长的过程。在机器彻底掌握方法论之前,人们只能一个动作一个动作地教给它。唯一不同的是,因为这些动作都来自于图片的原因,这样的训练对AI来说并没有挑战,它也不需要从最简单的开始学习,这些技术宅的品味反倒是成为学习顺序和方法科学与否的唯一标准。
猜猜它最先学会的是哪个手势?
一定有人猜了中指食指微微弯曲的那个手势,图不方便放上来,不过那个确实是第二个学会的
再到一个月前,骨骼插件“ControlNet”发布,他支持通过框架去画主体的动作。这几乎是划时代的技术,很快有人通过这个插件制作了手部的骨骼模型。
我不会像那些人一样直接写上“手部难关已被攻克”再加上几个毫无意义的感叹号,但至少在这之后,怎么让“Ai画手”这个事,人们终于看到了一条清晰明确的解决思路,剩下的都只是训练量的问题。
类似的故事比比皆是。
去年12月来自画师@花椰菜的透明人体 因为ai难以模仿短暂地引起过讨论。有专业的画师说这是因为这种风格“透视很见功夫”。
但一个多月后,Ai就学会了。
对于AI来说,难的不是透视而是性癖。只是透明人也好,手也好,他们最终通过一个叫做“好胜心”的东西变得不那么冷门了。
不过让这种冷门的爱好变得不再冷门的过程有另一种形式的意义。
简单地说,当它们冷门并且小众的时候,“喂的不够”是限制它们产能发展的原因。这也许就是AI技术和历史上大部分技术革命不同的地方。哪怕你只是把它当作一个玩具,这个行为本身也可以产生属于它自己生产力的价值。
就好比“Ai画手”的故事里,这个课题最终从一个小众的性癖变成了一种大众的念头,在这个过程中,互联网社区里每个个体琐碎的欲望、念头、审美最终会被汇聚成一起,变成了一个可以产生力量的声音。
撰文 3F王 编辑3F王 设计3斤
本平台采用作者征稿制度
如有任何交流需求
我们向你开放作者联系方式
微信扫码关注该文公众号作者