商汤距离“逆天改命”还有多远？

2024-05-26 04:05

商汤选择AII In AI

最近一家叫商汤的科技公司，股价上市从10元一直跌到0.58元，然后3天时间又直接翻1倍到1.2元。商汤的“暴利式上涨”直接让投资者大开了眼界，不知道的还以为商汤发布了“中国版GPT-5”！

股价异动一天之后，商汤集团终于发布公告。公告对推出日日新5.0业务做了一番简短介绍，对于股价的不寻常波动，公告中称，“董事会并不知悉有关价格和交易量变动的任何原因，或须予以公布以避免本公司证券出现虚假市场的任何资料，或根据香港法例第571章证券及期货条例需进行披露的任何内幕消息。”

从目前来看并没有什么交易异常，市场的焦点基本还在商汤发布的大模型上。那么国内大模型月月都有上新，商汤大模型特殊在什么地方呢？

4月23日，商汤科技举行新品发布会，亮出了大模型最新成果——“日日新5.0”。据介绍，该模型采用了时下流行的MOE（Mixtureof Experts）混合专家架构，拥有高达200K的推理上下文窗口，旨在全面对标GPT-4Turbo——OpenAI迄今为止最强大的大型语言模型。

日前，中文大模型测评基准SuperCLUE发布最新榜单，对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评，结果显示在SuperCLUE综合基准上，日日新 5.0表现不俗，以总分80.03分的优异成绩刷新国内最好成绩，并在中文综合成绩上超过GPT-4-Turbo-0125。

商汤发布截至2023年年度业绩公告，公司实现营收34亿元，同比下滑10.6%；年度亏损64.95亿元，较2022年同期的60.93亿元增加6.6%。整体上看依然难言摆脱亏损上岸，但来自生成式AI业务的收入为12亿元，同比增长200%。

商汤为此将原本的 4 个主营业务——智慧城市、智慧商业、智慧生活和智能汽车，重新划分为 3 大板块——“传统 AI” 业务（智慧商业、智慧生活、智慧城市构成）、“智能汽车业务” 和 “生成式 AI 业务” 。商汤对这些业务态度分明：收缩传统 AI 业务，集中资源投入生成式 AI 业务。

这是商汤成立以来的最大一次转型，它已部分反映在业绩上：据今年 3 月底发布的 2023 年年报，商汤生成式 AI 业务去年的总收入达 12 亿元人民币，营收占比为 35%，而过去曾占商汤收入大头的智慧城市业务占比已降至 10% 以内。一位商汤管理层人士预测：今年或明年，商汤生成式 AI 的营收占比例将超 50%。

国内这一两年来但凡跟AI沾点边的上市公司，都在努力全面拥抱AI尽全力把自己包装成为AI大模型公司，在各种榜单上各种限定词下超越GPT-4。投资人朱啸虎曾言，“大家都说自己很快能超越GPT-4，但好像没有一家能做得出来。” 李开复也十分直接地抨击了“作秀式的评测方式”，他指出“相反，那些选择作秀式的评测方式，忽视真实应用效果的厂商，模型能力与市场需求之间的鸿沟会越发明显，最终将难以在激烈的市场竞争中立足。”

那么商汤凭什么脱颖而出呢？OpenAI首席科学家Ilya Sutskever的老师神经网络之父Geoffrey Hinton指出，大模型竞争最终要靠大量数据和高计算规模（硬件能力）。商汤在视觉识别领域的积累在国内绝对是第一梯队的，这在多模态大模型研发中多少会有点优势。其次，据了解，2023 年初时，商汤大装置就已有 2.7 万张 GPU，目前则上升至 4.5 万张GPU，算力较去年翻倍。是不是最强的不好说，但至少对小米、工商银行、本田、广汽有一定吸引力。

大模型已能解决越来越多问题，但是随着技术发展，商汤认为模型并非越大越好。为了更好适应端侧场景，商汤还训练了一系列不同规格的小模型，它们能在汽车、笔记本电脑和手机等移动设备上运行。商汤已与早期客户小米、荣耀等手机品牌达成了共同探索更多端侧应用的合作。汽车客户则有本田和广汽埃安等，其模型已运营在上百万辆汽车上。

大模型已经“卷上天”

在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中，作者提到“大模型在性能提升方面可能已达到收益递减的临界点。”作者以OpenAI为例，认为：“从GPT-2到GPT-3的巨大飞跃。从GPT-3到GPT-4的巨大飞跃......GPT-4到GPT-4 Turbo就没有那么多了。”

简单来说按照目前的性能指标各家大模型表现并没有指数级差距，也就是目前无论国内还是国外非常容易陷入同质化竞争。所以OpenAI还是微软谷歌都在强调需要“降本增效”，技术投入和商业化都需要重视。微软总裁纳德拉指出过去一年 GPT-4 性能提升了 6 倍，但成本降低到了之前的 1/12，对应性能/成本提升了 70 倍。

对于存在“先天不足”的国内大模型来说，现阶段必须“尸山血海”的卷出来，不然很难活到AI下一个爆发阶段。

5月13日，OpenAI推出了新一代的大模型GPT-4o，除了性能上的大幅提升之外，更重磅的是该新模型将全部功能有限度的免费使用。不难看出OpenAI对目前的商业化进度并不满意，免费开放或许才能创造更大的市场更多的营收。

带头大哥都如此，那国内大模型没有理由不跟进。5月6日，国内创业公司幻方旗下的大模型公司「深度求索」开源了第二代 MoE 模型：DeepSeek-V2，主打参数更多、能力更强、还把推理成本降到了 1 块钱/百万 token，也就是说，成本是 Llama3 70B 的七分之一，GPT-4 Turbo 的七十分之一。

智谱AI在5月11日宣布大幅降价，新注册用户获得的额度从500万tokens提升至2500万tokens，GLM-3 Turbo模型中，用户1元可以买100万tokens。

字节跳动在15号发布会上，宣布降价，相当于1元可以买125万的豆包pro32k模型tokens。

5月21日，阿里也降低了大模型价格，通义千问GPT-4级主力模型Qwen-Long，API输入价1元可以买200万tokens。

百度智能云官宣文心大模型主力模型ERNIE Speed（上下文长度 8K、128K）、ERNIE Lite（上下文长度 8K、128K）免费。腾讯混元大模型也宣布全面降价，混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens，下降55%，API输出价格从0.01元/千tokens降至0.005元/千tokens，下降50%，lite版免费。

大有不赚钱也要卷死对手的架势，但是目前的免费主要针对的是C端B端市场还做不到免费。B端商业市场免费并不重要，重要的是能否落地产生利润，如果费效比高那么贵一点也不是不能接受。

有业内人士指出衡量大模型成功与否的标准，并不只是有多少参数，而是它究竟能解决什么样的场景难题，而且这个场景问题，用AI解决成本更低、安全性更高。

正如百度总裁李彦宏所说生成式对话价值不大，但结合具体业务的AI应用价值巨大。

例如去年底发布以来，阿里巴巴近1.7万中小外贸商家订购了AI生意助手，发布了上百万商品，搜索量提升近四成。字节跳动将豆包大模型接入了抖音、飞书等业务，日均处理1200亿token文本。腾讯已经把混元大模型用在了会议、读书与游戏客服上；这家社交巨头最大的资产是用户时间，AI支持的广告服务的点击率与交易量实现了两位数的上升。

商汤一开始的重点就不在C端的通用大模型，而是尝试在做好端侧大模型，满足客户出于轻量敏捷、安全稳定和成本等方面的考虑，在设备本地运算端侧大模型。商汤新推出的1.8B（18亿）参数规模的SenseChat-Lite版本端侧⼤模型，在基准测试中，全面超越了MiniCPM-2B、Phi-2等所有开源的同量级的大模型，甚至越级比肩一些7B、13B的大模型，性能、指标非常硬核。

商汤首席科学家王晓刚曾与媒体交流，“每年有30亿部手机，PC出货量一年有2-3亿台规模，AI PC可以成为我们每个人的助手，汽车智能化也处在重要的发展机遇期。”与商汤在端侧大模型展开合作的，已经覆盖了国内绝大部分的手机厂商和知名车企。

不过端侧大模型也存在不同类型终端系统繁多、算力水平差异大且适配困难，通信情况复杂且不稳定等问题。如果没有明显优于GPT系列的能力，那么长期来看会出现留存率低用户付费意愿低的情况。

大模型全面盈利短期是不可能的事

有市场人士认为国内AI公司存在以下上市套路：第一步大额融资，第二步不顾亏损和质量做大收入，第三步冲击IPO，第四步收入下滑，毛利率上升，应收账款大额坏账，第五步市值持续暴跌。普遍存在单个行业还没有深耕好，就开始摊大饼式的发展，追求收入和合同规模的增长，低价竞争和垫资，而忽视了经营的可持续性和竞争力。

过去的商汤赶上了互联网加的风口，追求算法能力的泛化尽可能做大的确存在以上嫌疑，但如今的商汤更加专注于结合具体场景的解决方案，为客户带来成本优化和收入成本。商汤未必能走到最后，但至少目前还在正确的道路上。

但在大模型卷上天的大背景下，不能只是说我有客户我能落地，现在的投资人不仅要看研发投入、营收规模及增速，也更看重主业净利率水平。

去年大模型爆发的一年，商汤反而研发投入只有34.66亿元，同比下降近14%，这跟国内外大厂不断加码AI的态势形成了鲜明对比，让投资人不得不担忧商汤后面是否能够跟上。

国金证券分析师近日发布研报，预计商汤2024至2026年归母净利润分别为-47.8/-33.8/-20.1亿元，亏损同比缩窄25.8%/29.3%/40.5%。

根据券商预计，商汤未来还将继续亏损，预计2024至2026年合计亏损100亿元，当然实际情况如何，有待时间验证。AI的成长空间依然很大远没有到尽头，但是还能带飞商汤多远并不是明确的事。某种程度上来说AI既是蓝海也是红海，综合素质更强的大模型才能笑到最后。

不管媒体们如何渲染AI强大颠覆世界，都不要忘了，AI至今仍然是一个长周期，高成本投入回报慢的行业。

5 月 23 日，美国众议院外交事务委员会以压倒性多数投票提交了一项法案，该法案将使美国政府更容易限制 AI 系统的出口。其意在限制中国使用美国开源大模型，可能会对一些依赖美国大模型微调的企业形成一定冲击。虽然这次只是外事委员会的初步投票，但目前紧张的地缘环境后续加码限制AI将会是大概率事件。

对于中国AI企业来说，开源虽然更容易上手见效快，但被封禁惨遭清零的风险显然越来越来。不管是商汤这类传统AI小巨人也好，还是大模型五虎，该交的学费不可避免，自研弄潮者或许才能走得更远。

参考资料：

商汤“一日惊魂” 来源：凤凰财经

中国大模型价格战背后的真相来源：极客公园

大模型价格战开打来源：新硅NewGeeK

商汤科技如何“封神”？来源：Z Potentials

商汤科技欲借大模型翻身来源：产业资本

商汤转型生成式AI这一年来源：LatePost

端侧大模型将商汤推向了关键时刻来源：新眸

如果你是AI从业者或者对其相当感兴趣，

请加作者微信，拉你进AI高质量交流群

- END -

最新话题：曾毓群：新能源电池回收，中国领先世界

欢迎关注“首席商业评论”视频号留言讨论！

投稿及内容合作｜[email protected]

广告及商务合作｜[email protected]

点击“在看”，拥有相互成就的关系！

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章