AI 2.0时代,商汤靠什么「突围」?丨氪金公众号新闻2024-03-29 11:03生成式AI成为商汤新的增长引擎。作为中国最早一批投入人工智能基础设施的公司之一,在成立的第十个年头,商汤迎来了自家生成式AI业务的爆发式增长。3月26日,商汤在港交所披露其2023年业绩。财报显示,2023年商汤实现总收入34亿元,借助“大装置+大模型”的协同布局,其生成式AI业务在去年创造出11.8亿元的收入,增速近200%,营收贡献率达到35%。在大模型遍地开花,呈现井喷式发展的契机下,生成式AI业务成为商汤以最快速度从无到有并超过10亿元收入体量的新业务。“生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。”商汤科技董事长兼CEO徐立如是说。打铁仍需自身硬,商汤抢占AI 2.0先机前不久,徐立在2024全球开发者先锋大会(GDC)上曾发表主旨演讲。他表示:“最近,‘新质生产力’成为热议话题,尤其在开发者领域,生成式AI被视为引领生产力突破的技术,也标志着人工智能进入了一个新的发展阶段,我们称之为AI 2.0时代。”与AI 1.0相比,AI 2.0标志着从基于规则的自动化处理向深度学习和自主学习能力的飞跃。这一跃进不仅提高了AI的理解能力,更赋予了机器创造性思考的可能性,从根本上改变了AI在社会各领域中的应用景象。《新一代人工智能基础设施白皮书》认为,新一代人工智能基础设施将会通过支持大模型的爆发式发展,带来知识工程的生产力变革,重构软件生态,颠覆原有数字经济霸主,并随着本身的技术革新和突破,实现边际成本持续下降,边际效益持续增长等特征,进而实现AI算力成本的持续下降,真正带来普惠AI。换言之,AI 2.0时代,人工智能将不仅仅只是效率的提升者,更成为推动未来社会进步和产业革新的关键力量。在这样一个关键节点,商汤凭借其"大模型+大装置"的协同策略突围而出。查阅官方资料显示,不足一年时间,“日日新”大模型已升级至4.0版本,且其能力每隔三个月就会显著提升,迭代速度之快不仅揭示了生成式AI模型潜在的巨大发展潜力,也指向了其作为新营收支柱的可能性。然而,标志着技术快速前进的道路并非全是平坦,挑战亦随之浮现。相关数据显示,过去四年,大模型参数量以年均400%的复合增长率增长,AI算力需求的增长也超过15倍。如此庞大的数据量,以CPU为中心的传统计算基础设施已经无法满足需求。在这一背景下,必然需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地。打铁仍需自身硬,因此,要想搭高楼,前提是要夯实地基。此时,算法、算力和数据的整合显得尤为重要,而商汤的前瞻布局则在此刻适时发挥了作用。2018年前后,商汤开始每年数十亿投入到专为AI原生打造的智算云服务平台——SenseCore商汤大装置,并建设上海临港超算中心。五年时间里,商汤大装置的总算力规模突破性增长至12,000 petaFLOPS,上线GPU数量高达45,000卡。SenseCore商汤大装置已成为国内稀缺的大模型基础设施。在算力和数据规模支持下,"日日新"大模型得以持续优化。以“日日新”4.0版本为例,其在代码编写、数据分析和医疗问答等多个场景中展现的能力,已与GPT-4不相上下。立于AI 2.0的最前沿,商汤进一步率先推出“模型即服务”商业模式,使客户能够轻松微调和使用各类生成式AI功能,无需承担建设和管理底层基础设施的负担,为商汤在市场中带来众多正面评价。打造生成式AI新高地,底气从何而来作为国内首批符合《生成式人工智能服务管理暂行办法》的企业,商汤在生成式AI领域的爆发式增长并非一蹴而就,也绝非一日之功。首先,过去十年间,商汤在感知智能、决策智能领域的积累,多模态数据的储备,强化了商汤基础模型对物理世界的理解和多模态能力,为其在生成式AI的发展和实践中打下良好基础。其次,“大装置+大模型”的协同优势进一步提升,其大装置平台显著提升了大模型训练的支撑能力。除了万卡算力的加持,商汤还维持了高达90%的加速效率并实现了超过30天的稳定训练,训练中断恢复时间更是优化至半小时内。第三,在实现从AI 1.0到AI 2.0的跃迁过程中,端侧部署的积累必不可少。自2015年起,商汤便开始同全球主要的安卓手机厂商和主流车企合作,将感知与决策类的AI模型植入至超过20亿台手机和数百万台汽车中,实现端侧推理的极致优化。商汤的服务范围广泛,据财报披露,商汤已与包括全球科技巨头高通、国内三大电信运营商、金融领域的领军企业如招商银行、海通证券以及互联网行业的重要玩家如京东、小米、荣耀在内的广泛行业领域建立合作。基于这一深厚积累,商汤率先推出了业界性能最优、推理速度最快的端侧小模型,例如,同样是7B模型,商汤的性能领先于Meta的Llama2和谷歌的Gemma。这一举措不仅帮助商汤有效地满足市场对高效、低成本AI解决方案的需求。值得关注的是,在过去一年内,商汤生成式AI业务超过70%的客户为新客户,这不仅彰显了市场对商汤技术的广泛认可,也为公司业务增长注入了强劲动力。商汤在端侧部署领域的成功实践,增强了商汤在技术竞争中的议价能力和市场影响力,为其在端侧生成式AI业务领域的未来扩张提供了广阔的空间。最后,大模型“花样百出”,但最终仍需“落在实处”,商汤始终将AI技术在实际应用场景中的落地作为重点。“日日新”大模型已在金融、医疗、智能终端等多个行业展现出显著的应用价值,证明了其广泛的适用性和强大的业务推动能力。在金融行业,商汤通过检索增强生成(RAG)技术,显著提升了 模型的数据处理和问题回答能力,中国银行、招商银行、中国工商银行等均采用“日日新”大模型构建其“数字员工”和“数字客服”系统。在医疗领域,其“商量 •大医”大模型能够提供专业的医疗知识问答服务,并具备医学图像的识别能力,已应用于多家顶级医疗机构,有效提升了医疗服务质量和效率。综上所述,商汤在生成式AI领域的成功,归因于其在技术开发和商业应用方面的紧密集成。从"大模型+大装置"战略,到感知智能、决策智能以及端侧部署的积累,再到AI落地应用场景,商汤完成了从研发到商业化应用的闭环,形成驱动商汤在该领域业务持续增长的关键动力。由点到面,产业质变的动力源下半场的竞争早已不限于技术本身,而在于生态拓展。随着ChatGPT引发的大模型热潮和日益增长的大模型开发需求,在推进公司业务成长的同时,商汤也在驱动整个AI产业的的升级和质变的过程中,扮演着举足轻重的角色。商汤科技董事长兼CEO徐立曾强调,AI大装置是商汤长线核心竞争力的标志,是公司持续经营和更大规模跃迁的护城河,以及推动AI时代生产要素降低的关键一步。国际知名调研机构弗若斯特沙利文《2023年中国AI开发平台市场报告》显示,SenseCore商汤大装置可实现大模型推理效率提升600%,大模型增量训练降低90%。依托SenseCore商汤大装置这一强大的AI开发平台,商汤正在为越来越多的企业提供算力支持,最新财报显示,商汤订单金额超过千万元人民币的客户数已达到数十家。从客户名单看,商汤的典型客户来自各行各业,比如三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,HiDream.ai、澜舟科技等创业公司、清华大学、上海交通大学等学术机构,,商汤已然成为大模型产业的推动者。业内共识是,作为培育新质生产力的重要工具,生成式AI具有带来生产力突破的潜力。在这一趋势下,通过开发先进的生成式AI工具,商汤正在重新定义生产力工具的边界,其秒画文生图模型的参数量已经升级至百亿参数级别;即将在4月推出的“日日新5.0”将支持百万字无损上下文。过去一年,大模型赛道神仙打架,但能否真正实现应用落地,则成为检验大模型能力的关键。正因此,商汤的脚步并未完全停留于模型与平台开发上,在应用和基础设施层上的深耕,正在让商汤成为连接不同产业需求与AI技术能力的桥梁。具体来看,在应用层面,商汤推出“日日新全家桶”“小浣熊”等一系列创新性生成式AI工具,为不同行业提供了新质生产力解决方案。在基础设施层面,商汤的大装置平台也成为了芯片验证的重要场所,SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型都已成功通过与华为Atlas系列服务器的相互兼容性测试。尤其值得一提的,是商汤基于商汤的“日日新SenseNova”大语言模型打造的AI Native生产力系列工具“小浣熊家族”。其中,AI编程助手“代码小浣熊”可提升编程效率超50%,在权威测试中,一次通过率达到75.6%,超过GPT-4的74.4%。AI数据分析工具“办公小浣熊”则能够通过自然语言输入,自动将数据转化为有意义的分析和可视化结果,其底层技术商汤日日新·商量语言大模型-数据分析版本,在测试中也以85.71%的正确率胜过GPT-4。通过两款工具,商汤展示出其在大模型技术在实际工作场景中的高效性和创新性,标志着商汤在AI的商业化落地方面上走在了前列。AI 2.0时代的序幕已然拉开,商汤管理层认为,生成式AI业务在2024年预计将继续保持高速增长。十年淬炼,商汤又站在新的起点上,走向属于自己的2.0时代。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章