Redian新闻
>
大模型狂飙半年,“群模乱舞”谁能胜出

大模型狂飙半年,“群模乱舞”谁能胜出

公众号新闻

“军备赛”开始了。


来源 | 壹DU财经
作者 | Apple
出品 | 资人说(touzirenshuo)



毫无疑问,当前的科技圈已进入“大模型”时代。含“模”量大到什么程度?

但凡科技企业,基本都在做“大模型”。

“从去年12月ChatGPT(Chat Generative Pre-trained Transformer)引爆科技圈之后,几乎所有行业玩家都想抓住这根救命稻草。因为做成了就意味着抓住未来几十年的趋势。”

行业创业者夏先生对我们说道:“ChatGPT是生成式AI,是大模型的落地场景之一。理论上讲,这条路的走通,加速了大模型在短期内的爆发。”


的确,ChatGPT的爆发,让更多人看到了语言模型的魅力。

微软、谷歌、百度、阿里等国内外科技巨头快速响应,相继推出自家的AI聊天机器人,试图以To C作为切入口,抢占市场。

风口在哪里,资金和人才就在哪里。

随后,先是厂商陆续宣布推出大模型,如百度的文心大模型、阿里的通义大模型、腾讯的行业大模型,后有科技圈曾经的风云人物也开始陆续入场,李开复、王小川、周伯文、王慧文等。

出行、认知、办公等一些垂直领域的大模型也相继推出。

半年时间,国内呈现出“群模乱舞”盛况。

而在经历喧嚣后,大模型或许是时候回归现实了。

玩家们开始意识到,最初的热闹仅仅是热闹,他们最终的战场在B端市场。

此时,多家有着人工智能积累和云计算大厂登台,相继推出了AI大模型服务。

行业老炮和新手创业者的对决,也就此开始了。

01

热情高涨

玩家们跑步入场


进入2023年,大模型技术让科技圈沸腾起来。

看到ChatGPT爆发后,不少大厂抓紧时间推出相应产品,新老创业者们着急招兵买马,生怕慢一步就错过了这难得的风口。

一级市场关于大模型的投融资热度也在攀升,不少FA开始疯狂补课。

一时间,整个行业热闹非常。

在OpenAI发布GPT4大模型后,第一个采取行动的是百度,在3月16日用“Demo演示”的形式正式发布文心一言。

同样在3月,已经沉寂许多的周鸿祎推出大模型产品,甚至连名字都没来得及取。


在此之后,科技巨头、创业公司和高校研究院们展开了一场关于“大模型”的竞速赛。

整个4月,都成了“大模型的发布月”,华为、商汤、阿里都在4月份亮出了自己的大模型产品。

到了5月,讯飞推出了自己的星火大模型,并公布了大模型在自己优势领域的诸多应用场景。

创业者们也在火速入场。

原美团联合创始人王惠文(目前已退出)、创新工场CEO李开复、前京东AI掌门人周伯文、前阿里技术副总裁贾扬清等开始招兵买马。

前搜狗CEO王小川的百川智能拿到5000万美元融资后,甚至扬言:“今年年底做到国内最好的”。

“这波创业热潮有点2000年左右的互联网创业潮的意思。”

一位业内人士说道:“似乎每个创业者都想在这个时代找到第二春。”

总体来看,今年上半年,大模型几乎成为所有科技企业的必选项。

对于普通人而言,大模型或许是件很遥远的事。

毕竟不是每次科技浪潮都能成功靠岸,如元宇宙、XR等行业。

但事实上,大模型的应用更多在B端市场。

那么,在行业烈火烹油过后,摆在这些玩家眼前的,理应是他们对市场更多的理性思考。

比如市场是否真的需要大模型?

大模型真正走向成熟,需要越过哪些重要关卡?能否真正意义上实现商业化。

02

“军备赛”开打


大模型军备赛的冲锋号吹响后,整个行业开始“卷”起来。

更多玩家已经将视线移至应用层面。

因为行业“退烧”后,最终考验的还是玩家们的“硬实力”。

此时,一些在人工智能、云计算上有积累的玩家则占据的先发优势。

尤其是模型的参数量。

就目前市场上发布的AI模型来看,虽然大家都自称为“大模型“,但参数量实质是大模型和小模型的界定因素之一。

此前,百度集团副总裁侯震宇在交流时曾表示,2022年,10亿参数的模型就叫大模型。

但到了眼下,千亿参数以上才会出现“智能涌现”,才会形成泛化能力,才能在各个场景下具备通用能力。

何为“智能涌现”?

简单地讲,当模型规模、算力水平超过某个参数阈值后,AI效果将不再是随机概率事件。

比如初期语言大模型出现“图不对文”“答非所问”等现象。

并且在通用领域,参数量越大,智能通常涌现的可能性就越大,AI准确率就越高。

在垂直领域则更容易获得精确的效果。

今年5月,科技部下属的中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》统计,截至5月28日,国内10亿级参数规模以上基础大模型至少已发布79个。

但可以看到,10亿级参数这个量级,很可能不是真正的“分界线”。

因为现实的情况是,一些未能达到千亿规模的模型,很难在当前市场的竞争具有竞争力。

不过,也不排除一些在垂直领域深耕的玩家,最终能跑出来。

“大模型需要算力、算法和数据积累,绝对不是玩概念的事情,最终还是要市场买单。”

夏先生认为,目前来看诸如百度、腾讯、阿里无论是在资源还是积累上,都有一定的优势,“他们在云市场深耕,并在自己擅长的领域积累多年,无论技术层面还是行业积累上,实质已经完成了抢跑,未来就看这些头部玩家如何落地。”

而在投入层面,这会是一个天文数字。

以百度为例。

据透露,过去10年,百度在AI方向的投入已超过1000亿元。

但大模型不是投一笔钱、做一个模型那么简单,它需要有算力、有数据、有经验丰富的AI工程师在好的研发平台上长期积累。

而创业公司如果直接去做基础大模型,除了上述投入之外,还需要能够把模型、算力管理好的AI开发平台。

这意味着,创业公司不论是自建开发平台,还是采购外包平台,其投入都不会是小数目。

并且,大模型不是预训练出来就好,更需要后续持续敏捷迭代。

从这一点看,创业公司所受的限制明显要高于大公司。

但大厂很难留住强算法人才的弊端也比较突出,因为大模型投入是一件长期主义的事,必定会面临与既有业务之间的冲突。

这一点,从大厂出走的大模型创业者的经历,就说明了一点。

长期主义对创业公司同样重要,无论是创始人的背景背书,还是资源合作,抑或是客户的拓展,都需要长期积淀。

03

行业竞赛即将鸣枪


人工智能专家侯世达的学生梅拉妮·米歇尔《AI 3.0时代》一书中提到,研究人工智能与赛道中的创业者们都熟悉了一种模式——

先是“人工智能的春天”,紧接着是过度的承诺和媒体炒作,接下来便是“人工智能的寒冬”。

并且,他认为这一模式将以五到十年为周期不断上演。

具体到2023年上半年的大模型赛道,显然其正处于第二个阶段——行业很火,市场很热。

这一周期往往是最短的,也通常意味着如此去泡沫化后,赛道竞争即将正式开始。

大模型比拼的不仅仅是技术,还应该将重点放在大模型应用、产业生态中去评估。

目前,市场上大模型的玩家主要分三类。

一是聚焦基础层,主要对标OpenAI,发挥基础设施的作用。

第二类是锚定中间层,不需要像OpenAI一样花大钱做底层,只需要掌握通用化能力,就可以通过开源大模型做精调,让模型具备差异化能力,最终可以形成垂直类模型。

第三类是调用大模型API的企业,专注开发大模型具体场景的应用,如Jasper。

相对而言,前两类又是大模型的“基础设施”,因为有极高的门槛,对技术、资金以及资源有严格的准入壁垒,往往是大公司布局的主要方向。

目前来看,百度、阿里和华为在大模型的构建上,不约而同地采用了“模型+工具平台+生态”的三层共建模式。

腾讯云则更专注于应用层而,6月19日公布的腾讯云MaaS服务解决方案即覆盖了金融、文旅、政务、教育等10个行业、超50个解决方案。


虽然巨头们参与竞争的姿势不同,但目标实质上只有一个,那就是打通应用层。

在百度创始人李彦宏看来,应用层最具想象空间。

商汤科技联合创始人杨帆认为,AI 基础设施本质上还是算力、数据、基础算法,包括算法相关的工具,本质上还是三位一体的东西。

最后谁能把这三者的整合能力提供的好,提供更低成本、更低门槛的能力是决定整个竞争最重要的点。

04

结  语


AI大模型是人工智能迈向通用智能的里程碑式技术,因为其可为各行各业的智能化升级提供强劲的生产力工具。

在千行百业数字化转型升级的当下,大模型的重要意义不言而喻。

也因此,在当下,谁能率先在赛道里抢到更多筹码,就非常关键了。

可以预料,未来,抛开“基础设施”层面的较量外,真正的战场大概率是各行各业的切实落地上。


  ·   END   ·  



近 期 活 动


----------------------------------------

----------------------------------------


阅 读 推 荐


· 从8位大佬在乌镇互联网大会的演讲中,我看到了这个趋势

· 沃衍资本魏斌:制造业投资大有可为,选对方向才是关键

· 雷军小目标:做世界TOP5,每年至少1000万辆

· 沈南鹏:15年投了上千创业者,我发现这样的CEO能成事

· 张一鸣:为什么我不赞同控制人力成本?


视 频 推 荐



合 作 对 接


寻求报道、商务合作、投融资对接媒体互推、开白、投稿、爆料等……

扫码添加投资人说运营者微信,备注「商务合作」详细沟通。



超 级 社 群


【投资人说】正在组建超级投资者社群、超级创业者社群、超级读者群、超级媒体群等,目前总人数已超1000人。


关注【投资人说】微信公众号,发送信息「进群」,与各行业精英直接交流,共同进步。



旗 下 媒 体


发现在看了吗,戳下看看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
第四届济安金信“群星汇”评奖揭晓 广发基金斩获“群星奖”等6大奖项十亿参数,一键瘦身!「模型减重」神器增强型 SmoothQuant,让大模型狂掉 3/4“群里35个人,34个都是托,就你1个是真的!”NZ财长透露重磅消息:年省$10亿!国家党、行动党“群嘲”:别挥霍纳税人的钱了!群魔乱舞时刻来了!州长签新法纽约成跨性别者及其家庭避风港。十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」加州| 89岁传奇“高龄政客”被质疑健康状况堪忧!是否能胜任工作职务?小红书和微博,谁在“白嫖”谁?《江山无限》&合唱《飞鸟和蝉》念了一辈子大白字百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报国内首次研究:“圆房失败”谁之过?大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例“乐夏”回归,B站再战音综,“优爱腾芒B”谁是暑期档综艺“头牌”?连夜涨价100万!北京、广州群魔乱舞Transformer出逃八子最后一人正式创业!坐标日本搞AI“群”模型,本人:在谷歌有被困住的感觉希腊雅典,海港黎明能胜任统计学家?Transformers超强学习机制「自动算法选择」开始涨价!北京、广州、沈阳,群魔乱舞了十亿参数,一键瘦身!「模型减重」神器让大模型狂掉 3/4小说:兰欣与乌茶 21手机里的心理医生,ChatGPT能胜任吗?|《自然》长文只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型大模型狂飙半年,掏出真金白银的投资人是少数|甲子光年​被认为不能胜任,投行总经理被开除后状告老东家,讨还800多万奖金!法院判了...今年鞋圈“千金”谁还没有?!逛街不累脚,洋气巨显贵!可怕!“群里35个人,34个都是托”阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报五月天演唱会30万张门票5秒售罄,“黄牛”谁来管?这儿理工科落后,而最落后的是文科谷歌证实大模型能顿悟,特殊方法能让模型快速泛化,或将打破大模型黑箱令人震惊一幕!“群鲨撕咬小海豚”
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。