Redian新闻
>
30个大模型,抢着落地|直击WAIC 2023

30个大模型,抢着落地|直击WAIC 2023

公众号新闻

AI落地难,大模型还要再经历一次。


邓咏仪

编辑苏建勋

来源|智能涌现(ID:AIEmergence)

封面来源IC photo
在2023年上海人工智能大会(WAIC)逛一圈,如果你想找大模型厂商,无需思考——找人扎堆的地方就可以。
作为国内AI界当之无愧的风向标,WAIC这次的主题前所未有地清晰——AI大模型。本届WAIC邀请超过400个企业参会,主办方甚至特设了AI大模型展区,大模型参数在10亿以上的AI厂商数量,就超过30家。
“大模型太多了!如果有哪家AI公司不做大模型,都不好意思露面了。”人声鼎沸的大模型展区中,一位投资人对36氪如此感叹。
无论是大厂还是垂直厂商,AI+多个行业解决方案已是标配。大模型展区宛如一个大型超市,专属解决方案琳琅满目,陈列其中:大模型+云计算、大模型+金融、大模型+教育……
但火热表象下,国内大模型产品“大同小异”——是36氪得到的普遍反馈。这既是技术发展初期的无奈,也同样是一种理性的现实。

百度文心一言企业级平台展区 拍摄:36氪

错位
ChatGPT火爆全球大半年后,如果说还有什么东西成为共识,“先落地”可能算第二个。
AI厂商再也不吹概念,迅速寻求在B端落地,这和2015年的AI浪潮全然不同。比如,腾讯云至今没有公布通用大模型“混元”的进展,但在6月中旬先高调公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。
这明显是国内客户更感兴趣的方向。
在百度文心一言、阿里通义千问的展位上,“企业级平台”、“专属大模型”被围了里三层外三层,来询问的企业客户络绎不绝。
一位文心一言员工告诉36氪,来咨询的客户,最关心的问题在于价格,其次是数据安全。“都直接问卖多少钱,什么时候能开始用。”
但大模型私有部署和使用成本还是太高,再加上算力供不应求。大部分企业其实暂时很难用上大模型,这种错位可能还要持续一段时间。
比如,阿里和百度如今都还是只定向邀约客户使用,标准化的API服务还没有全面开放。
一位外企IT从业者对36氪表示,他在日本的老板“很着急,很希望能尽快把大模型放到产品里,6月专门来国内找AI大模型服务商,8月还打算再来一趟。”
但在WAIC逛了一圈,上述从业者发现,现在的模型体量还是太大,部署太贵,“我们还是希望先找一个小的切入点,比如用较小的模型做智能客服,嵌入到业务当中。”
另一位阿里云员工则告诉36氪,现在做一个行业或者专属大模型,一般需要千万级别以上的预算,更适合业务体量较大的央国企和大公司。“部署成本比较高,我们也希望尽快把模型压缩到大家能接受的水平。”
为了解决“贵”的问题,阿里云也在通过开源模型、做生态来补足。阿里发起的大模型开源社区“魔搭”,就想做成一个大模型超市,陈列出更偏行业化的专属模型,目前已经聚集了900多个AI模型。

大会上,阿里云也发布了新品“魔搭GPT”(ModelScopeGPT)。用户通过输入指令,可以一键调用其他的AI模型,用多个模型协同完成复杂任务,这也是降低大模型使用门槛的方式。

AI落地难,大模型要再经历一次
从年初业内惊叹ChatGPT的涌现算起,AI大模型的热度也不过半年。国内AI厂商离ChatGPT仍有不短的距离,但随着国内厂商迅速选择落地,不少难点已经显现。
本质上,AI大模型训练仍然昂贵,即便是大厂,也不可能不求回报地一直投入。这意味着,国内厂商刚开始做大模型,就面临着更残酷的生存考验。抢着在行业落地,也是希望能尽快商业化,再投入到AI模型的开发和训练中。
但资金只是入门券。抢先在行业落地,厂商们更多的是想抢占数据“高地”。
如果是做模型是烹饪,数据好比是食材,大模型对高质量的“食材”需求更高。但在公开互联网中,中文的高质量数据本就偏少,大模型厂商其实很难建立起数据壁垒。在国内厂商尚在追赶GPT-3.5的情况下,没有谁能显著拉开差距。
在很长一段时间中,数据会是更难的一环。一位头部社交厂商战略人士告诉36氪,ChatGPT出来后,公司团队迅速就将国内大模型看了一遍,也都进行相应测试,“但他们既没有这个赛道的高质量数据,通用大模型能力又尚不足以支撑业务需求,测试下来,大家效果都一般般。”
为了拿到数据,一位大厂的大模型产品负责人对36氪表示,在其合作模式中,如果企业客户愿意提供数据(越有行业属性越好),他们愿意在商务权益上做出极大让步,甚至愿意免费为提供数据的客户部署大模型。
想要大模型顺利落地到场景中,难度也丝毫没有减小。
“企业需要的,是在实际场景中真正解决某个问题,而不是在100个场景中解决了70%-80%的问题。”腾讯云副总裁吴云声在WAIC演讲中表示。
问题在于,上一波以视觉识别(CV)为首的AI浪潮里,厂商们更先发展的是单点AI能力——比如用AI进行人脸识别,以API形式单次收费是更普遍的形式。但随着技术走向同质化,AI厂商们到后来只能开始做大项目、私有化部署。由于难标准化,账其实很难算得过来。
将大模型用在业务里,AI模型会和客户的核心数据结合得更加紧密。这意味着,想要真正解决客户最核心的业务问题,私有化必不可少,程度可能还会更深——厂商们也许需要帮助客户,从头对核心数据进行标注、训练,再进行模型训练。
谈及私有化大模型的投入产出比,账能算得过来吗?腾讯副总裁、腾讯云智能负责人吴运声对36氪坦承:“从现在的时间节点上看的话,确实会有比较大的挑战。”
如今,腾讯采取一种较为折中的办法——上个月,腾讯推出面向文旅、政务、教育、金融等十大行业,超过五十个解决方案。相当于“前进半步”,客户并不需要从头提供行业数据进行训练。在这些模型的基础上,客户只需要加入自己的场景数据进行精调,就可以快速生成“专属模型”。
归根到底,AI大模型技术仍然在快速发展中,成本上的博弈其实尚无定论。吴运声对此表示乐观:“大模型的核心技术,以及算法、芯片等上游产业链都在快速迭代,成本下降其实很快。”
再以百度为例,百度在今年3月发布AI大模型,到了5月,调用文心一言的成本,就已经降低到刚发布时的10%。
而另一边,AI大模型会带来更大的应用层机会,用户付费意愿也会更高,这会带来更大的收入增量。
比如,近期行业里就冒出了不少针对营销场景的AI产品,有了AI大模型加持后效果显著,比如AI数字人——近期,不少数字人公司因此焕发新机,产品也迅速带来公司收入提升。

36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

来个“分享、点赞、在看”👇

30个大模型抢着落地

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
晨跑,今天第二次爬梯开门乱记之二: 五四断想有人讨论 中国西湖大学的 2023 暑假PROGRAM吗?360正式发布自研大模型,周鸿祎:国产大模型追赶GPT4的速度远超想象如何快速实现大模型落地?5小时get大模型时代实战密码!目前只To B,腾讯云为什么优先发布行业大模型,而非大模型?阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl华为率先把大模型接入手机!小艺+大模型,智慧助手智商+++大模型进入「落地战」,腾讯云下手「行业」大模型国润储能完成近2亿元A轮融资,加速全钒液流电池落地|36氪独家对话中国大模型的最早推行者黄铁军:全球可能只需要三个大模型生态坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」大模型可以摆脱落地难的问题吗?InfoQ 大模型技术应用创新大赛正式开启!聚焦AIGC for Code,「硅心科技aiXcoder」完成A+轮融资,加速行业落地|早起看早期为了纪念的回忆——王光美的特务问题和我父亲的冤案 任小彬 2023百度云上交大模型成绩单:接入42个大模型,月活企业近万家|甲子光年AI、数字孪生、数字化精益在工业制造场景如何落地|今晚直播引入33个大模型,百度智能云千帆大模型平台的“破茧时刻”电信扣费异常遭吐槽;OpenAI首笔收购来了;北京明确支持机器人重大项目落地|AIoT情报澳洲teenager手持斧头袭击Woolies员工!抢劫数箱饮料后逃离2023 唱坛母亲节快闪【谁言寸草心】合辑To B大模型,一场重塑企业软件的大模型革命※※ 2023 唱坛5.4快闪【路过青春:闪亮青春 VS 狗血青春】合辑 + 母亲节活动【谁言寸草心】通知 ※※小说连载《东莞旧事》12.夜店心理学只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型抢口罩,抢消毒水,抢药,抢盐的,都是同一批人!接入Llama 2等33个大模型,上线Prompt模板,百度智能云千帆大模型平台重磅升级澳洲青少年手持斧头袭击Woolies员工! 竟只为了抢劫这些东西...快手自研大模型「快意」亮相,在多个大模型榜单上表现优异斯年智驾再获新一轮战略融资,场景物流无人驾驶走向规模化落地|甲子光年读不懂明确而简单的例证?AI大模型如何在行业实际落地:企业对话场景拥抱大模型之路开门乱记之一: 龙井忆往大模型颠覆研发模式:字节跳动是如何在单元测试中落地大模型的?百度云MaaS升级:接入国内外33个大模型,进行二次性能增强|甲子光年百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报暴走1万步,36氪带你看AI春晚|直击WAIC 2023对话|三个月诞生79个基础大模型,中国到底需要什么大模型?今天买到TACL2023 | 中科院 针对NL2Code任务,调研了27个大模型,并指出5个重要挑战
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。