行业大模型急不得
GPT的发布,是人类科技历史上的里程碑事件,短短几个月席卷全球。在见证80多个公开测试后,大模型的未来走向,成为行业当下关注的焦点。
热潮之下,牌桌上的“玩家”达成共识,大模型在行业应用扎实落地,方能做深、走远。正如华为云的盘古大模型,不作诗,只做事;腾讯云的大模型,要在实际场景中解决具体问题。紧跟风口的投资人朱啸虎,告诫创业者“不要迷信通用大模型”,坦言“场景优先,数据为王”。
对大模型价值的认知觉醒,使中国大模型的探索者,不再执着于成为“中国的OpenAI”,也不再单纯追求参数算力规模,而是将目光锁定在严肃场景锻造价值。京东入局,为大模型发展再度明确了风向。
7月13日,2023京东全球科技探索者大会暨京东云峰会推出了京东言犀大模型。这一源于产业,服务产业的大模型,以数智供应链为着手点,训练时融合70%的通用数据与30%数智供应链原生数据,致力于面向知识密集型、任务型产业场景,解决真实产业问题。
关于路径选择的考量,京东集团CEO许冉给出了答案:“产业属性是京东技术的鲜明特征。京东研发每一项技术,都将产业属性作为出发点,将产业价值作为目标。技术源于产业需求,历练于产业场景,创造产业价值。”
此轮大模型竞逐中,不急于求成,深扎产业,是京东人当下的心态写照。大模型只是起点,深入产业,如在“长坡”铺“厚雪”,京东已做好充分准备。
打破大模型的产业瓶颈
1956年,美国汉诺斯小镇宁静的达特茅斯学院中,几十位科学家聚在一起,探讨如何用机器来模仿人类学习。这次会议,成为人工智能发展的标志性节点。这一年,也被认为是人工智能元年。
近70年来,人工智能技术的发展,曾数次抵达应用爆发边缘,但很多技术创造的价值有限。人们开始思考,根本原因或许就在于,技术没有扎实落在产业实处。
大模型的角力方向逐渐清晰,开启产业智能的金钥匙,将属于打破产业瓶颈的深耕者。
大模型在产业扎根并不容易。企业对模型容忍度低,对精度和效率要求更高,95%的精度是行业门槛,而在to C场景,60%的准确度就足以娱乐大众。
正如过去一段时间里,国内追赶ChatGPT热潮的对话交互类大模型,可以满足用户聊天等基础需求,但放在具体严肃的商业场景中,显得捉襟见肘。
比如通用大模型基于通用的交互数据,可以轻松撰写文案,但在品牌营销实战中,精准输出忠实于产品特点、准确描述尺寸、材质、功能等信息的文案,却是专有大模型才具备的能力。
让大模型在产业场景中可用、好用,专有数据是必备的“燃料”,更是核心生产要素。“只有在自己的场景,才能培养出适合自己的大模型应用。”京东集团副总裁、京东科技产品与解决方案总裁高礼强对《中国企业家》表示。
产业智能,率先发生在数字化领先行业
大模型的出现,让致力于用技术改变生活与生产的革新者,捕捉到产业智能临近的脚步声——过去人工智能“教过的会,没教过的不会”;如今大模型让智能涌现,“没教过的也会,甚至会的更多”。
作为产业数字化的深度参与者,京东云在面对人工智能的“iPhone时刻”,显得理性且克制。它给出了自己的判断:产业智能不会一蹴而就,数字化的深厚积累是撬动产业智能的重要支点。
深入全渠道一盘货、供应链金融科技、产业协同、数据中台、数字仓库、智慧园区、混合多云、金融增长云、乡村振兴、冷链物流、农业金融科技、城市一网协同、城市一网统管等20多个数字化场景,服务100多座城市、2500多家大型企业、944家金融机构和超250万家中小微企业。这些数字,是数字化时代,京东云给出的成绩单。
这也让京东逐渐厘清,数字化领先的行业,拥有更高质量数据,智能化将在这里率先落地。
这一趋势,对“牌桌上的人”提出了更高要求:一方面,要求具备深厚的技术积累;另一方面,要求具备高质量行业数据。这离不开更强大的数据平台,和更强的智能交互能力。前者持续输出知识,后者持续反馈高质量协同数据,才能实现高质量行业数据的积累。
这正是京东擅长的。据《中国企业家》了解,在言犀之前,京东已深耕大模型技术3年。
早在2021年,京东首次推出十亿级模型K-PLUG,生成的商品文案覆盖京东超3000个品类,累计生成30亿字,人工审核通过率超过95%,带来超过3亿元GMV,助力品牌降本增效;
2022年,京东推出的百亿级模型Vega,广泛应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等自然语言处理任务;
今天,言犀大模型的参数达到千亿级,围绕内容生成、人机对话、用户意图理解、信息抽取、情感分类,实现基座模型+垂直领域模型精调,深入零售、物流、金融、健康、政务等垂直场景。
产业原生的高质量数据,则来自于京东云数智供应链。过去,它是京东深入数字化的重要抓手,在眼下和未来,它更是推动大模型走向行业深处的“引擎”。这在众多大模型中,构成了独具京东特色的“供应链模式”。
数智供应链上,京东服务的千万自营商品SKU、5000万工业品SKU、超800万家活跃企业客户、全国超2000个产业带的真实需求,诞生出长链路、复杂协同的原生数据,更适合产业大模型的训练,让言犀大模型更好地落地产业。
产业“长坡”铺“厚雪”
20年前,电商平台初兴之时,京东选择自建物流配送体系,这条艰难的路却在后来为其构筑了核心壁垒;当下,站在人工智能技术变革的十字路口,京东再一次给出坚定选择:
聚焦更深厚长远的产业价值,让大模型成为推动科技跨越发展、产业优化升级、生产力整体跃升的“新引擎”。
早在2022年7月,京东就基于内部实践,上线了产业原生模型,随后在零售、物流、健康、金融等复杂内部场景中不断迭代。直到今天,阶段性成果受到行业关注。
AI增长营销平台是京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索。通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品、研发、算法、设计、分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。
比如在零售场景,直播带货成为电商标配,但直播间运营并非易事。京东云基于10余年智能对话经验与多模态交互技术积淀,借助言犀数字人大模型,只需5分钟简易拍摄,便可为虚拟主播生成侧脸、走动、手势等,支持动态局部高清与语义驱动的肢体动作编排,进一步降低操作门槛与操作难度。
中小商家的使用门槛更低,仅需在直播后台上传商品链接,数字人便能够智能阅读商品详情,甄别关键规格、卖点,自动生成更真实、生动、可阅读性强的直播文案。商家原先写出50个SKU的直播脚本,需要至少五小时,如今可以一键生成,直播间运营效率大幅提升。目前,京东云多模态数字人已经入驻4000多个品牌直播间,带动超8亿元GMV。
数字人之外, AIGC 正让内容营销变得更智能。京东全品类丰富的商品数据锻造的大模型,更准确地理解商品特征,帮助商家自动化生成商品图片、卖点,大幅提升运营工作效率和营销内容质量。这让过去营销物料的7天生产周期,缩短到半天,更让每套图文的成本降低90%。
全自动智能仓内的“地狼”机器人
在京东生态内,物流同样是重要场景。如今,借助言犀大模型,京东在仓内智能交互建模方面,实现对仓库布局问题的智能化原因分析。当“双11”大促遇到布局堵点时,大模型会分析判断地狼货架数目不够,建议增加一排货架,极大减少了传统方法花在调研、分析上的巨大成本。
大模型的底层,是言犀AI开发计算平台。
它沉淀了京东在零售、物流、健康、金融等行业多年积累的知识,集成了京东技术团队研发的超100种场景的AI算法和工具,打造低代码AI平台,为用户提供从数据模型到应用服务的全周期管理,实现真正的MaaS(模型即服务)。
之前需要10余人科学家团队的工作,现在只需要1~2位算法人员,训练效率提升2倍,推理提效6.2倍,成本节约近90%。
《中国企业家》获悉,为在大模型这条“长坡厚雪”的赛道上做深做实,2023年下半年,融合升级的产品和行业解决方案,京东言犀大模型将继续在内部场景大规模锤炼;2024年起,针对严肃商业场景将大模型能力对外开放,服务产业。
这注定又是一次艰难的技术长征。正如京东集团CEO许冉所说,“从产业端切入大模型,如同从北坡攀爬技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景,有巨大的探索价值。”
面向未来,在大模型落地产业这条路上,京东能走多远?时间将会是最好的证明。
新闻热线&投稿邮箱:[email protected]
值班编辑:姚赟 审校:吴莹 制作:张怡然
关注“中国企业家”视频号
看更多大佬观点和幕后故事
[ 推荐阅读 ]
微信扫码关注该文公众号作者