现阶段,如果要拿出“可用”的大模型,还需要科技公司和行业用户的协同合作
文|施然
大模型发挥生产力作用,路径设计是关键。
出于对下一代人工智能长期演进的笃定,中国大模型狂飙7个月,科技部《中国人工智能大模型地图研究报告》显示,中国研发的10亿参数规模以上大模型已发布79个,位居全球第二。
盘点“遍地开花”的大模型,不难发现,在当前中国大模型的语境下,“通用模式”和“垂直模式”都有其拥护者。后续入场“投票”的用户们,将决定哪条路径更受欢迎。
7月13日,京东发布言犀大模型,大模型领域又出现了新入场者。
2023京东全球科技探索者大会暨京东云峰会上,京东推出言犀大模型。言犀大模型源于产业、服务产业,融合70%通用数据与30%数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。 通用模式的ChatGPT推出时,瞄准的是C端应用。上线不到两个月,月活用户就超过1亿,迅速成为全球最热门的应用之一。这个通用大模型,因为精度高和应用广,展现出了巨大的想象力,被部分行业人士视作通往AGI(通用人工智能,具备与人类同等智能、或超越人类的人工智能)的坦途,并一度成为辨别科技公司前沿技术能力的检验器。ChatGPT之后,中国科技公司纷纷推出相关产品,比如百度的“文心”大模型、阿里巴巴的“通义”大模型。通用大模型对数据、算力的要求极高,高昂的成本,对大公司而言都稍感压力,更遑论本身就资金紧张的小公司,让大模型C端的变现路径更加扑朔迷离。业界人士坦言,“(通用大模型)目前仍是一门烧钱生意”。公开报道称,推出ChatGPT的OpenAI,去年一年亏损5.4亿美元。分析公司Similarweb数据显示,今年6月,ChatGPT首次出现用户数量下滑,其全球桌面和移动设备流量较5月下降9.7%,网站的独立用户访问量下降5.78%。与此同时,通用大模型也经常出现“一本正经瞎编”的现象,暴露了专业领域知识储备不足的问题。像法律、医疗、金融这类严肃行业,AI精准率如果不能达到95%,就无法实现商用。因此,很多公司偏向于有具体场景的行业大模型。这种“垂直模式”的大模型,为付费能力更强的B端客户提供服务,或许是当下更实际的商业化选择。最近一个月,腾讯云推出金融、政府、教育等一系列行业大模型,华为同样发布面向政务、金融、制造、矿山等行业的“盘古3.0”大模型。中国科学院院士张钹表示,专业的企业和组织将加速大模型在实体产业落地,具有数智供应链优势的企业,要将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为行业提供大模型服务。供应链“气质”是行业对京东的共识。京东认为,言犀大模型是在“通用模式”和“垂直模式”之外,开辟了有京东特色的“供应链模式”。
只有将供应链做透,才能将大模型做实。京东集团技术委员会主席、京东云事业部总裁曹鹏表示,数智供应链,是大模型走向产业应用的着力点,大模型要以数智供应链为抓手,走向产业,深入实体。20年来,京东从一家B2C电商企业,逐步进化成以供应链整合为核心能力、融入产业链上下游、提高产业链整体运转效率的科技公司。供应链是京东的核心竞争力。自2017年全面向技术转型以来,京东体系投入超1000亿元技术研发费用,不断强化技术能力和产业数字化效能。为大模型注入产业能力,高质量的专业数据必不可少。言犀大模型的训练数据,包含70%的通用数据和30%的数智供应链原生数据。京东数智供应链,服务超千万商品SKU、800多万家活跃企业客户(其中世界500强企业超90%、全国专精特新中小企业近70%)、全国2000多条产业带。这条长链路、场景复杂、数据丰富的数智供应链,能为大模型提供“训练场”。京东集团副总裁、京东健康技术产品部总经理李欣介绍,在京东健康平台上,每天超过30万次问诊,已经积累了上亿级的医疗问诊数据,还有超过10万执业医生,这些数据还在不断增加,“这是我们训练医疗大模型的基础。”数智供应链的能量,也在京东物流场景释放。京东平台上,每天有超过1000万的包裹流动,从仓库货架、储位、人工,到网点、车辆、配送员,再到每个包裹的搬运流程,以及配送员和用户的交流过程,都有多模态数据沉淀。京东集团副总裁、京东物流技术专委会主席何田表示,对于京东来说,供应链每优化1分,带来的都是巨大成果,例如物流中某一项指标,仅提升0.1%,每年都能影响超过1000万个包裹。有了这些真实场景的数据,京东训练出了面向产业的大模型,而言犀大模型,又将帮助京东进一步做透供应链。今年京东618,言犀数字人在4000多家品牌直播间里带动了8亿元GMV。商家只需要5分钟拍摄,就能定制形象、音色、动作,生成专属数字人,降低了中小商家的使用门槛。而商家想要卖货,抓住客户眼球,可以在京东云AIGC内容营销平台上调用大模型能力。商家上传一张产品图片,能自动生成商品图、海报、卖点、详情等营销素材。京东表示,新商家开店、上品、营销物料准备的周期,从7天缩短到半天。在医疗健康领域,京东健康整合大模型能力、积累的3千万条高质量数据、百万级规模医学知识图谱,以及庞大的医疗专家团队,来提升健康助手和辅助诊疗的效率。在物流领域的“质量检测”场景中,涉及仓内工作、调车、运输、配送等检测环节。何田说,整个链条至少有上千个环节。想要整个物流系统高效运转,就必须保障每个环节都顺畅运行,过去是用人工来做检测,未来大模型能够极大提升效率。京东集团技术委员会主席、京东云事业部总裁曹鹏表示,所有技术都是工具而非目标,“发大模型不是目的,我们希望的是用新技术来带动产业变革。”
尽管不少业内人士都提到“所有行业都值得用大模型再做一次”,但并非所有行业都会很快用上。现阶段,如果要拿出“可用”的大模型,还需要科技公司和行业用户的协同合作。京东云针对不同客户的诉求,提供一系列的大模型,从10亿级、百亿级到千亿级,也会提供大模型和小模型的搭配使用,因为在B端“1分钱都能影响成本。”京东表示,在言犀AI开发计算平台上,沉淀了京东零售、物流、健康、金融等行业知识,部署100多种训练和推理优化工具,结合低代码应用平台,可以为客户提供数据建设、模型应用一站式服务。该平台搭载了100多种训练和推理优化工具,1到2个算法人员在此环境中,不到一周就能完成数据准备、模型训练和模型部署,为企业打造更适配的垂直大模型。而这一工作,此前需10余人的科学家团队协作完成。 京东集团副总裁、京东科技解决方案中心负责人高礼强认为,智能化会优先在数字化成熟的行业发生。从头部科技公司发布的大模型策略中可以发现,有几个重点领域是被反复提及的,例如金融和政务。这两个领域有一些共同的特点:交互频次高、数据积累多,且愿意为新技术买单。在城市治理领域,京东已经开始发挥大模型的价值。2021年,京东云以大模型能力,助力上海普陀区城市智慧升级。京东云依托智能城市操作系统,打造了城市运行支撑平台和城市运行能力中心的智能交互平台,服务普陀区推进“一网统管”,实现一屏发现、一口派单、一站处置、一网评效、一键智搜,打造特大城市“智”理新样板。今年,京东云凭借该项目被上海市政府授予“上海科学技术奖一等奖”。从ChatGPT引爆科技领域,到大模型百花齐放,再到产业落地,无论是“通用模式”,“垂直模式”,还是京东的“供应链模式”,可以预见,新一波的AI浪潮将加速渗透各行各业。在京东看来,人工智能是一场非常严肃的技术革命,需要具备长期主义的心态。京东不会把没有实现“色香味俱全”的菜肴端上餐桌,只有在内部的关键场景完成了历练和实践的大模型,京东才会开放给合作伙伴,走向产业,带动整个行业降本增效。7月13日,京东集团CEO许冉说:“从产业端切入大模型,如同从北坡攀爬技术珠峰,道路虽然更加艰难,却有更波澜壮阔的风景,有巨大的探索价值。”