Redian新闻
>
干货 | AI大模型的8条“反共识”和“冷思考”

干货 | AI大模型的8条“反共识”和“冷思考”

公众号新闻


  核心观点 👉


1️⃣ AI大模型还处于萌芽阶段,既有新方向,也有大忽悠。我记得好多年前,计算机刚刚开始普及,那时候连算命的都叫“电脑算命”,价格还挺贵。不久之后呢?
2️⃣ 中国的AI公司或者大模型公司,面对的最主要的问题不是技术问题,而是商业问题。我们判断,未来应该是混合模型。所以像我们小冰,还有很多同行,都已经在布局更小参数规模的模型。
3️⃣ 越大的模型越容易同质化。想象一下,一个班上的同学,训练数据是相同的,训练方法是相似的,老师也是同一个,越大规模参数的大模型,不就越可能同质化吗?
4️⃣ 大模型公司能不能养活自己?API的商业模式会不会被开源颠覆?随着行业的内卷,大模型本身将不再是一个昂贵的东西,大模型将越来越不值钱。
5️⃣ 我们有两个坚持:第一,我们不愿意收不是AI的钱。第二,我们不只靠卖技术赚钱。小冰在积极推进新的商业模式,是一种共享终端利益的商业模式,而不是一种提供铲子的商业模式。
6️⃣ 人工智能公司的护城河到底是什么?以前搞人工智能搞自然语言处理的团队,全国算起来可能也没多少,大模型出现以后大家发现谁都可以做。技术本身越来越不成为护城河。什么是护城河?Deep Relationship,有用户数据,有深厚关系。
7️⃣ AI是助手,而不是对手。小冰是打造用户与AI的“孤岛”,而不是建立用户与用户的“广场”。与同行业者普遍使用的“广场”、“话题”、“排行榜”等产品设计不同,小冰的每个用户仅能与AI接触,从产品底层设计逻辑上,避免了用户之间的任何聚集。
8️⃣ 产品中不冒然使用大模型,而是使用技术成熟的小模型和检索模型。小冰目前在产品中,仅使用技术成熟的小模型,模型参数规模最大仅为3.5B,最小为0.5B。同时综合运用了技术更为成熟的检索模型作为安全模式。


先关注  慢慢看

小冰公司前身微软小冰团队,
是微软全球最大的人工智能独立产品研发团队小冰框架目前是全球承载交互量最大的人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。
2020年7月,小冰开始独立运营,微软互联网工程院副院长李笛担任CEO。2021年7月,小冰公司完成A轮融资,估值超10亿美元。2022年11月,小冰公司宣布完成10亿元融资估值超20亿美元少女小冰、Rinna、夏语冰、小堂妹、冬奥裁判观君等AI虚拟人,都是小冰框架孵化出的AI Being。

以下内容来自小冰CEO李笛的分享,希望能给大家带来一些启发。

01

AI还处于萌芽阶段,不乏大忽悠


我必须先谈一件事,这件事情直接影响我们各行各业如何看待大模型。
坦率来说,我个人观点,人工智能发展到今天为止,仍处于孟德尔刚刚发现遗传学规律的那会。
也就是说,当下的AI大模型,也还处于萌芽阶段。
在萌芽阶段,可以想象,也可以看到,各种各样跟大模型有关的东西都会冒出来。有一些是真正的新方向,有一些就是大忽悠。
我记得好多年前,计算机刚刚开始普及,那时候就出现了“电脑算命”,价格还挺贵。
很多人认为,大模型新的能力会不断地涌现,谁在大模型时代领先一步,谁就能够在接下来的时间里面步步领先。
可惜,事物的发展并不是如此。更像是一个波形,大模型在接下来也会遇到瓶颈。整个科技界会期待新的方法,下一波浪潮也会来解决我们当下遇到的这些瓶颈问题。
第二点,我想跟大家分享的是,截至目前,对于大模型时代的技术,科学家们还只是停留在一个观察结果上面,并没有特别多的关于背后原理的了解。
我们今天还处在人工智能的蛮荒时代,更准确地说,是蛮荒时代的一次剧烈波动期。
我个人判断,从现在开始,到明年二季度,大模型等技术还会产生剧烈的波动。

02

只有老二,才有意愿“颠覆创新”


我在微软的时候,除了是小冰的负责人,还是微软搜索引擎必应的亚洲负责人。
从我的视角来看,为什么最先推出大模型的公司不是谷歌?是因为它没有吗?
因为,谷歌在搜索引擎领域处于老大的位置。
微软必应在全球范围内最大的竞争对手是谷歌。谷歌大约是必应的10倍左右。
当微软使用大模型来冲击这个市场的时候,谷歌要印证,就必须付出10倍的成本。
此外,由于谷歌在搜索引擎上面的收入非常大,当他使用新的技术范式的时候,会直接导致毛利迅速下降,已经构建成功的商业模式也会迅速破坏。
谷歌没有任何的主动意愿,在自己占据优势的领域尝试新的技术模式。
但对于微软,大模型就是一个非常棒的挑战者的新武器。
百度在几个月前宣布推出文心一言的时候,很多人都认为他会将文心用到搜索引擎。我们当时判断是不太可能的,更可能的方式是将大模型利用到百度占据老二老三的位置上去。果然,最后它是和百度云深度捆绑。
对于大公司来讲,如果你已经在某一个市场具备领先地位,应该把大模型当作战略性储备武器。对于挑战者来讲,它是一个比较好的武器,使你有机会在短时间之内获得更多的份额。

03

大模型通吃,还是混合模型?


不同人看待大模型的视角不同,不可避免会附带各自的主观期望。我也会带有主观色彩,但尽量客观。
我认为,中国的AI公司或者大模型公司,面对的最主要的问题不是技术问题,而是商业模式问题。
几个月前,行业里面普遍认为大模型将通吃。换句话说,就是未来将有一个唯一的大模型,这个大模型能够取代其它已有的技术范式。这也是很多人贸然布局大模型的原因。
我们当时判断,不是这样的。大模型不是越大越好,大模型不会通吃,未来将是混合模型。
给大家举一个简单的例子:
如果你的模型参数规模控制在130亿以内,就可以用单卡的A100驱动这个模型;如果控制在70亿参数左右,可以用单卡的V100去驱动;如果控制在40亿参数规模,甚至可以用非常廉价的T4去驱动。
这中间产生的成本差,大概是百倍的差异。
所以像我们小冰,还有很多同行,其实都在布局更小参数规模的模型。

04

越大的模型越容易同质化


很多技术创新会有一种从众心态,从众就意味着整个领域会卷得非常快。
现在很多大模型,比如650亿参数以上的,甚至超过千亿参数的。
第一,它们都需要海量的数据。大部分的同行业者所拿到,或者所准备的训练数据,都是类似的,彼此之间差异不大。
第二,它们的训练方法也是类似的。大家都想先追上GPT,所以大家的训练方法也是相似的。
想象一下,一个班上的同学,训练数据是相同的,训练方法是相同的,老师是同一个。越大规模参数的大模型,不就越可能会同质化吗?
反而是中模型和小模型,因为训练数据少,所以能精细地筛选训练数据,训练方法也可以不同,就有可能产生足够高的差异性,进而形成壁垒。
还有,到目前为止,大模型的涌现是不是已经到了尾声?
有一种观点认为,再要涌现新的能力,可能需要参数规模三个数量级的增长。还有其他的观点,需要新的一种技术范式的变化,比如杨立昆提到的世界模型?
毫无疑问的是,涌现并没有像我们所想象的那样继续激动人心,这意味着什么?
这意味着对于大模型,基于当前技术进行场景应用深挖,变成了最至关重要的事情。

05

大模型公司能不能养活自己?


大模型公司能不能养活自己,我们都不讨论能不能赚钱。
先跟大家分享一个例子——“这个女孩叫小美”。
可能很多年轻的朋友,在B站、抖音上看过听过这种电影解说。实际上,这个声音是微软云服务里面所包含的一个声音。
很多视频创作者都使用了这个声音。其中,有的人短视频非常棒,赚了很多的钱。也有人,因为种种原因,短视频完全不挣钱。微软作为提供声音技术服务的公司,能不能从中获得不同的回报?
答案是否定的。
类比到人工智能。AIGC创造了巨大的价值,但是人工智能企业能不能从巨大价值中获得应有的价值?
答案可能也是否定的。
人工智能服务提供者,无论使用它做出来的内容是多么赚钱或者多么不赚钱,都只能按照次数或者时长来收取相同的钱。还有可能面对很多同行,以免费的方式来跟我竞争,最后大家谁都赚不到钱。
再给大家举一个例子:
一个媒体朋友,跟我咨询人工智能撰稿,让AI写出符合媒体调性又高质量的稿件。我好奇地问:“你愿意为此付多少钱?”对方回答:“这不是有定价吗?1000个Token 0.2美分。一个月200篇稿件。”我说:“刨去成本,我一个月能从你身上挣到多少钱,100块都不到。”
换作人类撰稿,一篇稿件要1500元起,200篇稿件则要35万。
人们是不会给人工智能企业按照创造的价值来付费的。
回顾过去,一些人工智能公司,比如做人脸识别的,帮我们解决了很大的问题,但它的服务很难收到钱。最后不得不去做软硬结合。
所以说,制约大模型和AI发展的,其实是经济学规律。

06

人工智能公司真正的护城河


这一波的人工智能新技术有一个巨大的特点,那就是,降低了人工智能领域从业者的进入门槛。
以前搞人工智能,搞自然语言处理的团队,全国算起来可能也没多少。大模型出现以后,大家发现谁都可以做大模型,甚至很多传统领域的企业,也开始亲自训练自己的大模型。
各行各业都可以参与其中,所以技术本身越来越不成为护城河。
那么什么才是人工智能公司的护城河?
我先给大家介绍一个例子:Inflection Pi。
Inflection AI近期宣布,在微软、里德·霍夫曼、比尔·盖茨、埃里克·施密特和新投资者英伟达(Nvidia)牵头的一轮融资中,筹集了13亿美元,总计融资达到15.25亿美元。据路透社报道,该公司最新一轮估值约为40亿美元。
Inflection AI首席执行官Suleyman介绍说:
“我们不知道所有的答案,但我们正在着手开发一种真正对你有用的个人智能,它就在你身边。我们的使命是将你的人工智能与你和你的兴趣坚定地联系在一起。这意味着设计一种人工智能,帮助你表达你的意图,组织你的生活,并在你需要的时候为你服务。”
ChatGPT 不管用户是谁,更关心后端,更像搜索引擎。
Inflection AI 寻找另外一条方向,认为护城河是我对用户的理解。
如果大家使用Inflection AI,会发现一个很明显的特点,袭天卷地的各种各样的提问,他会抓住一切机会去理解你,甚至一天之内会问你200个问题。
说实话,只要是具有相关从业经验,并且资金储备和算力储备差不多,技术产品上,谁也不会比谁领先一两个月的时间,但是用户数据的护城河能够领先很久。

07

AI是助手,而不是对手


我们以前认为,人工智能是可以取代人的。
但真的是这样吗?
比方说,已经有一个莫言了,人工智能是要写出比莫言更好的小说吗?不是的。
人工智能真正的特点和价值,是在同样质量的情况下,人工智能可以不眠不休,可以7×24小时,可以同时和千万人进行交互。
人工智能会不会取代人?如果他是我的助手,他就不会取代我。大家想想,如果今天每一个人类的创作者都有了一个助手,它可以帮助人类去更好地创作,不是更好吗?
按照助手的逻辑,AI一定和人是一对一交互的。
小冰致力于打造用户与AI的“孤岛”,而不是建立用户与用户的“广场”。
与同行业者普遍使用的“广场”、“话题”、“排行榜”等产品设计不同,小冰的每个用户仅能与AI接触,从产品底层设计逻辑上,避免了用户之间的任何聚集。
如果一定要把人工智能掺到人和人之间,无异于破坏式地改变原有的良性结构。

08

我们不赚不是AI的钱
也不只靠卖技术赚钱


以前的人工智能时代,或者说大模型出现以前。一家公司通过技术研发,掌握了一种别人很难追上的知识图谱的能力。现在,这件事情不存在了。
所以,如果做了一个抄袭型的大模型,达到了跟别人一样的质量,最后商业模式才是关键。如果率先推出了一个原创型的大模型,你就等着被别人追赶吧。为什么?因为大模型短期内看不到新的能力的涌现,所以你自己不能加速甩掉后面的跟从者,你只能在原地等着,直到被后来者追上。
我们可以看到,大模型多是API的商业模式,这个商业模式会不会被开源颠覆?随着行业的内卷,大模型本身将不再是一个昂贵的东西,大模型将越来越不值钱。
小冰在探索商业化的时候,有两个坚持:
第一,我们不愿意收不是AI的钱。比方说,有一个智能防盗门,可以人脸识别。它可能卖3000块钱,之所以卖3000块钱是因为防盗门的成本有2800元。所以,这2800元就不是AI的钱。我们今天有很多智能音箱,更多是音箱值那么多钱,而不是智能值那么多钱。
第二,我们不只靠卖技术赚钱。OpenAI把研究室的研究成果,API直接卖给客户来使用。我们追求的是,一定要取得实际产生价值的那部分。小冰在积极推进新的商业模式,是一种共享终端利益的商业模式,而不是一种提供铲子的商业模式。像我们跟奈飞、跟网易云音乐的合作,就是挣共创的钱。
我们也仍然只是在探索,小冰也有可能是前浪死在沙滩上。到目前为止,人工智能无论是ToC还是ToB,尚未产生一个成熟的或者成功的端到端的商业模式。所以各位,咱们大家都还有机会。


- 点击关注 -


我们正在寻找人工智能AIGC100人,加主编微信(张沉浮:chenfu3721)

✅ 我们推出了AIGC产业大课,目前第3期和第4期正在招募中(点击下方报名)

✅ 我们也在开展“AI创新大赛”,评选出2023人工智能ToP10(关注下期内容)



推荐阅读


ChatGPT们把营销彻底颠覆了!”


*
课程咨询 | 培训业务 | 公关传播 | 转载开白请在公众号后台回复  【合作 】

*免责声明:本文章为作者独立观点,不代表i黑马立场。



扫码加入黑马创业者交流群
↓↓↓

扫描下方二维码
加入黑马AIGC产业营
读懂AIGC底层逻辑,一步接入产业未来
↓↓↓

点击底部
分享、赞和在看,完成三连击,把好的内容传递给更多需要的人。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
德国的教会税(Kirchensteuer)关于“东方甄选APP初次开播”的冷思考对行业大模型的思考关于床上的“冷知识”,你知道多少?【首席观察】NBV回暖的冷思考:保险巨头如何“破旧立新”?课外活动如何兼顾“个性化”和“跨学科”,干货来了!垂直领域大模型的一些思考及开源模型汇总字节跳动李航:对语言大模型的若干观察和思考京东尚鑫:对中台疑云的几点冷思考|QCon 联席主席专访7、8月最适合去自驾的8条路线,沿途美成天堂,正适合夏天出发~科研上新 | 第2期:可驱动3D肖像生成;阅读文本密集图像的大模型;文本控制音色;基于大模型的推荐智能体父亲的期望[干货] “蒜头”和“蒜瓣”,英语分别怎么说?先诺欣获“专家共识”推荐:综合排名位列国产抗新冠药第一我的8条旅游经验300亿诈骗案:营销女王背后的8条企业“大腿”AI的大模型时代 ≠ 只有大模型的AI时代百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报大模型颠覆研发模式:字节跳动是如何在单元测试中落地大模型的?外交部发布!“中美双方达成五项共识”索赔1元的“大模型数据被盗第一案”和解;首个生成式AI监管文件正式施行;雷军:小爱同学已升级大模型丨AI周报ACL 2023 | 自查纠错:给大模型的“思考过程”注入知识以提高事实正确度尹锡悦政府为什么极力"反共"?一家创业公司“赶考”大模型140天:争吵、奔跑、新内卷小说连载《东莞旧事》21.不太功利的大都会大模型与知识图谱融合?爱数推出基于大模型的领域认知智能产品与方案[干货] 什么是“异化翻译”和“归化翻译”?中国液冷数据中心第一诞生!大模型时代需“冷平衡”一下台海观澜 | 侯友宜表态“九二共识”,郭台铭“壮志在我心”多款大模型向公众开放,实测“智商”和“情商”周末灌水:说说Kama Sutra这套书个人养老金半年考:市场热启动与机构冷思考[干货] “粗”和“细”,有哪些英文说法?兰德推演台海冲突++侯友宜喊出“九二共识”+琉球知事访华+075混合舰队穿越日本……原创《望》祝父亲节快乐!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。