Redian新闻
>
AI只会画画聊天?这家公司可能要打破一切了。

AI只会画画聊天?这家公司可能要打破一切了。

公众号新闻




如果说这半年来,当红炸子鸡是哪一位。


那 AI 生成内容说第二,恐怕也没有人敢说一。


虽说热度一直没停过,但是这几天感觉,看 AI 们乱杀,完全不如看它翻车来得有意思。比如下面这种认人成狗的乌龙。


又或者是这种莫名其妙直接让人头脚倒置的。。。


甚至互联网上还出现了一大批带着 AI 生成的图,想替兄弟讨回公道的网友们。


 连无穷小亮都中招了,在自己的微博声讨 AI 。


不过,AI 犯傻也不是一天两天了,自 从 DALL·E 带头的这批绘画模型出现后,各种段子就没停过。


比如因为喂的素材不够多,一旦涉及了知识盲区,AI 就开始不懂装懂,原地乱画。画出来的筷子,世超怎么看都觉得手里那个,更像我奶奶的锅刷。。。


输入的描述词如果有点抽象的话,AI 甚至会画出一些有点冒犯性的照片。


比如非常经典的 “ 鲑鱼回流 ” 图,是鲑鱼看了要喊律师的水平。


结果,这AI 绘画的热度还没降下来,AI 聊天就又来了。


世超左手边的同事在玩 Stable Diffusion ,右手边的人就在和 chatGPT 聊天。这款AI 聊天应用上线的时候,火到连马斯克都在调侃,人们陷入了一个 GPT 的循环里面。


世超自己还没体验上呢,各种网友调戏AI 聊天的段子又横空出世了。


 比如给AI 出脑筋急转弯,结果当然是一头撞到了墙上。



又或者是用中国人的经典小学数学题,考验对方。虽然 AI 答题态度很好,试卷题目都写满了,但是没一个答案是对的。。。


不过啊,玩归玩,闹归闹,但 AI 要是认真起来,实力早已经相当可怕了。


虽然 chatGPT 做不来脑经急转弯,但是它可以快速找出一段代码中的 bug ,并且完成代码修复。


而偶尔犯傻的 AI 绘画,如果调试得好,它甚至能帮你做出一张足以拿奖的作品。


国外甚至已经有人用chatGPT 和其他AI 绘画软件,创作了一本儿童读物《 Alice and Sparkle 》。目前,已经上架了亚马逊。。。


玩梗归玩梗,但 AI 的潜力网友们早就心知肚明。像老美做的 chatGPT 这类AI 应用,国内其实也早就有企业悄咪咪在跟进做了,比如抖音、意间之类的。


而这条赛道上,甚至还有一个你完全想不到的参赛选手,就是靠游戏起家的互联网出海巨头——昆仑万维


说实话,虽然它是以游戏起家的公司,但是世超第一时间想到的已经不是游戏业务,而是它在全球范围的各种业务和投资。

比如想要做浏览器,但是大部分浏览器市场都被谷歌牢牢地坐在屁股下面。


于是,昆仑想到了收购没落的 Opera 浏览器,带着它从非洲这个互联网增速最快的新市场入手,把这个没落的浏览器,扶上了非洲第二大浏览器的位置。


 再比如虽然也搞社交聊天,但是却投资了同性交友软件 Grindr 。因为群体的高消费属性,直接给企业带来 29.5亿的收益。。。


而这一次,昆仑万维早在 2020 年就瞄准了 AI 这个炙手可热的香饽饽。


虽然老本行靠游戏发家,但是昆仑做起 AI 项目来,也毫不马虎。前面咱们聊过的绘画和聊天模型,昆仑万维全都有布局。


废话不多说了,练家子还得拿出真本事来,咱们直接上手体验一下。


先是昆仑万维用现在最火的AI 绘画模型 Stable Diffusion ,做的一个支持中英文双语的AI 绘画模型——天工巧绘 SkyPaint 。


天工巧绘这个模型目前可以在小程序上体验它的实力,小程序界面非常简单,输入描述词后,就可以一键生成画作。而输入之后,程序都会一次性生成四张图片。


 世超体验了一下,基本上所有图片都能在 10 秒之内生成。


世超先用兄弟小黑胖试了一下,输入了:“ 一个丰富细节的小黑胖。” 


结果,小黑胖这么挫的名字,居然获得了一张这么细致的生成图。。。甚至连裤子和手部的纹理细节,都渲染出来了。


说实话,才 10 秒不到就能做出这么细致的图片,确实是超乎了世超的预期。


但是,光用这些普通的描述词有啥意思,不如给 AI 搞点抽象的东西,考验一下。

于是,世超尝试了一句陆游《 十一月四日风雨大作 》里的名句—— “ 铁马冰河入梦来 ” 


结果,天工巧绘真的画出了一只踏着云霞,毛发飘逸的铁青色马匹。


不服输的世超又用更抽象的 “ 灯火阑珊处 ” 试验了一下,结果也是非常惊喜。


 甚至,世超从这一句中文古诗词的生成结果里,感觉到了一些赛博朋克的味道。


向左滑动


可能有小伙伴发现了,世超从头到尾用的都是中文。甚至,后来使用的古诗词,天工巧绘都能很精准地读懂我的意思。


其实说到 AI 绘画,世超想要说一个容易被人遗忘的关键词输入


所有人都盯着最后生成的图片看,但是,却忘记了 AI 绘画的第一步其实是文本输入。

比如你想获得这样一张充满现代感,并且风格强烈的图片。


那你可能得输入长达七行的关键词,才能获得一张满意的作品。。


因此关键词还被做成了一门暴利的生意,一家叫 PromptBase 的公司,主就是专门售卖 “ 关键词 ” 。一个关键词,能卖到 1.99 美元的价格。。。


说实话,匮乏的英文储备,每次都限制了世超的发挥,用的时候,还得在旁边挂一个谷歌翻译。


这不,为了方便中文用户使用,昆仑万维直接做了一套中文文本模型


虽然咱看着好像没啥难度,不就是英译中吗。但是,这项目一开启,就是一个止不住的投资无底洞了。

首先中文是一种信息密度更高的多维语言,简单来说,就是表达的意思会比英文更复杂。


 这个前提下,要想做中文模型,就得花大量精力做语料清洗和中文语义的理解。为了提高 AI 的准确性,昆仑用了一种 “ 回报机制 ” 来训练这个模型,简单说就是给模型做的试卷打分。


给模型出一百道题,最后工程师们给 AI 提交的答案挨个评分。通过这种方式,给 AI 做一对一语文辅导,慢慢提成绩。


 这看似容易的英译中服务,其实非常烧钱。


昆仑万维为了做这块,光是加速卡就有两百多张,仅仅是硬件支出就得近千万,而这还不算人力成本投入。模型每个月的训练成本,又固定是上百万。。。

烧了这么多钱后,他们才慢慢把这套大语言模型打磨出来,用最少的人力,获得了很好的效果。


也是依靠着它,天工巧绘才能够很好地理解世超输入的中文语义。


而依托这套中文模型,昆仑万维也用 GPT3 做了一套 AI 文本模型——瑶光


除了基本的聊天回答、摘要、续写之类的功能,还有很多针对中国人的各种传统技能,比如对对联,古诗词之类的。


而 chatGPT 能够做到的代码修复,昆仑万维也没落下。他们直接做了一套 AI 编程助手SKYCODE ,只要给它输入一段代码,它就能帮程序员们完成后面的续写。


当然这套 AI 代码模型,也是完全支持中文注释的。


而在 AI 编曲赛道上,昆仑也是赛道的头部,依托自己的音乐社区 Starmaker ,昆仑搞到了目前市面上最全的音乐数据集。

旗下的 AI 音乐工作室StarX MusicX Lab 制作的曲子现在已经是非常成熟,大家在 Spotify 、QQ 音乐、网易云音乐上就能直接搜到。


这里贴首歌,差友们可以感受一下。


看到这,可能很多人会觉得疑惑了,为啥昆仑万维作为一家互联网平台出海企业,却看似 “ 不务正业 ” 地花这么多力气,来搞这个全新的业务呢?


其实,上面咱们聊的那么多东西,有个总称,也就是 AIGC 。说白了,就是让 AI 来提供和创造内容。


所以 AI 的用途,可远不止开头那些玩梗这么简单的。


虽然一开始,大家对AI 还都嗤之以鼻,早几年听过最多的词就是:人工智障。


包括 2019 年李开复在《 人工智能 》里说的,也只觉得 AI 最多,就只能够代替人们五秒钟的工作。比如人脸识别、淘宝客服回复的水平。


但是,慢慢地所有人都发现事情不简单了。


尤其是身处 2022 年年末的我们,被 AI 轰炸了一整年,眼看着 AI 绘画从 DALL E 到 Stable Diffusion ,AI 聊天从续写到及时应答。


当年的 DALL·E ▼


照这个势头下去,AI 似乎真的要奔着超越人类去了?


虽然还不至于到取代人类的地步,但是 AIGC 对我们生活的改变,很有可能有18 世纪时,人们跨入蒸汽时代那么大。


只不过,这一次负责驱动的,是一个看不见、摸不着的计算程序。


 AI 给人们带来的不是失业,而是人与机器共存、协作完成各类工作的全新时代。


而昆仑万维的所有布局,就是为了迎接这个时代。


就在昨天,昆仑万维召开了一场线上发布会,宣布把覆盖绘画、文本、编程三大块的 AIGC 模型,正式地开源发布。


这就意味着利用昆仑万维的算法与模型,作为应用开发的底层基石,所有人都可以自由地搭建自己需要的垂类应用。


昆仑万维会选择把耗费数千万的模型,对外开放的原因,一方面当然是希望通过更多人的参与,让昆仑天工有更多的应用可能性和创新性。


像完全开源的 Stable Diffusion ,网上就有各种各样地围绕它的创意版本。


网友魔改的宝可梦版 ▼


而另一方面,一项技术进步,只有给普通人带来便携,才具有正面的社会意义。


尤其是当技术都掌握在头部手里,算法的成本只会水涨船高。技术壁垒的高墙,就这样慢慢地越砌越高。


最后,个人开发者或者是小企业,就被会高成本拦在门外。


但是,昆仑万维觉得技术不应该只属于头部。所以,他们打从一开始,就是冲着对外开源这个方向去的。


通过模型开源,降低行业门槛和开发成本。而且,开发中文大语言模型作为支撑,更好地配合中文使用者的习惯。让更多的个人开发者或者是中小厂,也可以搭上AIGC 这辆高效的马车。


已经落地了的昆仑 AI 音乐就是很好的例子。


昆仑万维有一个叫 starmaker 的音乐 K 歌软件。可能你会有点陌生,因为它主要是面向的是海外用户,在南亚东南亚、中东南美洲地区的活跃用户已超过 5000 万。


昆仑根据 starmaker 开发了各种音乐类的游戏。对于音乐类游戏或者应用来说,歌曲库的丰富程度,肯定是执掌大局的关键。


但是,一首曲子的制作成本费用,最便宜也大概在三万多左右。。


有了自己的AI 音乐实验室 MusicX Lab 之后,他们利用 AI 就能快速玩出各种想要的音乐风格。最近,昆仑做了款音乐游戏,里面有接近两百多首的音乐,全都是来自这个工作室。


假设用 AI 制作只是省去一半成本,那也是减少了将近 300 万的支出。。。


这还仅仅只是 AI 音乐的可能性,之后 AIGC 还会深入到各种创作者的工作之中去。例如 AI 绘画以可以后帮助原画师、3D 美术师、艺术家等等进行内容创作,帮助画师们打开想象。


就算是普通的用户,也有使用它的可能。比如搭建一个专门做各种美甲图片的应用,美甲师们只需要动动手指,就能获得各种甲面风格。

甚至有一天,你可能会发现在文章的最后,署名不再是世超,而变成了 chaping AI 。


撰文:四大   编辑:面线&莽山烙铁头   

图片、资料来源:
昆仑万维发布会、Twitter
微博:@无穷小亮微博
@Ai绘画社:什么是关键词?如何写好一段关键词


(广告)


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
去一家公司就能盘活一家公司,只因他把芯片玩明白了九号 MMAX 110P:如何用十年沉淀,突破一个行业的天花板?虽然不会摄影,但是他会画画啊加拿大温哥华旅游攻略及美景:维多利亚+落基山脉+班芙国家公园+优鹤国家公园+强斯顿峡谷+水怪湖+冰川国家公园+弓河瀑布+朱砂湖西南巨环4日游丨拉斯维加斯出发+锡安国家公园+布莱斯峡谷国家公园+峡谷地国家公园+拱门国家公园+羚羊彩穴+大峡谷国家公园 BW4疫情以来的首个晚宴东京在召唤7-暴走东京什么情况?这家公司董事长被公安监视居住,股价刚创4年新高…"董事长们"为何接连被查?POCT可以更快吗?这家公司希望为行业带来突破性技术戴墨镜画画、抄袭?芒果台综艺《会画少年的天空》美术生看完都哭了...太惨了...悉尼美女发烧昏迷,醒后双腿和手指都被切了!这些致命的健康杀手,潜伏在每一个人身边...还没建成就要打破纪录!澳顶层公寓定价$1.4亿,每平米$10万鬼谷子识人三十六计,看破一个人的本质签证移民制度可能要大改?澳洲PR政策或将于今年发生巨变,永久居留可能将更难获得!谁泄露了两位区领导的私密聊天?旧金山进出7日游:火山口湖国家公园+雷尼尔山国家公园+西雅图+海岸星光号列车+波特兰+101公路神奇海岸线+红木国家公园 R7印尼部长对话马斯克:未来最值得从事的3个行业...只要没打破物理定律,一切皆有可能再打破一种垄断【油条报告】给搞不懂中国大胜美国与中国大败美国的差别的朋友们支一招精神分裂华女忘记吃药 将妹妹切了放锅里 消防员当时在场 公寓发现电锯、短斧和强酸溶剂等物品谷歌聊天机器人LaMDA被爆突然现身!只会聊狗子,被ChatGPT秒成渣14年来首次!加拿大房价打破一项下跌记录,入手最好时机已到?挪威交响诗 (八)从弗洛姆Flam—到盖朗厄尔Geiranger 登仙一处她爱上枪侠,甩了ABC?波士顿本周将迎来极寒天气!或将打破一项历史低温记录!老品牌如何突破年轻化困境?这家公司这样做一财务转出486万,结果傻眼:我们公司可能要垮了!“ 让人感受得很真切了……”如何跟孩子高质量聊天?这4个金句拿去就能用你真的能识破一个孩子的谎言吗?加拿大卡尔加里接机4日游:班芙国家公园+强斯顿峡谷+水怪湖+温哥华送机 弓河瀑布 露易丝湖 优鹤国家公园 冰川国家公园 WVC4马斯克又摊上事了?其脑机接口公司可能涉嫌动物实验违规这就是会画画的世界!梦女不可怕就怕梦女会画画!一个Al有多会聊天?情商比我高!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。