AI 画的一只鸟,啄开了京东云的技术大门
距离2017年京东提出三个技术的口号已经过去五年。
这五年来,京东通过技术沉淀的决心,进一步坐实了以供应链为基础的技术与服务企业的定位。
在数智供应链成为京东标签的同时,京东云也依托强大的 AI 技术,完成了它从里到外的华丽转身,成为京东技术对外输出的核心发力点。
那时 AIGC 还没火。
何晓冬记得,当时他刚回国不久。他与合作者提出的一个工作,叫「AttnGAN」,可以在计算机上输入一行文字描述,这个模型就会自动生成一只红白肚皮、蓝背的小鸟。
就像能读懂人的意志一样,让创造了它的何晓冬也感到震惊。
加入京东后,他把这个工作展示给了几位高管看后,大家都很赞叹,没想到 AI 的能力已经如此强大——
文字与图像是两种不同的模态,模态之间的交流与互动往往如跨越千山才能遇万水,但在人也尚且不能很好地理解 AI 的时候,AI 就已经能通过一段简短的文字描述画出相应的图像,而且准确率和清晰度都能与人类媲美。
那是 2018 年。输入文本控制图像生成的技术已经出现,但想象力还未形成。大家虽然赞叹,但回头一想,不知道这样的技术可以用在什么地方。
后来何晓冬告诉雷峰网,那时他刚加入京东,其实还做了不少 AIGC 方向的基础研究,例如文案生成、AI 写诗,还有跟中央美院的邱志杰教授合作探索AI画图、AI写书法等。而这篇 AttnGAN 的论文现在已经被引用超过1千多次了,是AIGC领域的经典工作之一。
但如果回顾京东的整个 AI 技术研发进化史,何晓冬用 AI 画鸟的研究,恰是其中一个缩影,也是一个不可缺少的注脚:
时间回到2017年,在那一年的京东年会上 「技术!技术!技术」被提出来,京东也由此迈入技术研发高速发展的阶段。
然而,彼时支撑京东技术野心之一的人工智能(AI)技术研发并没有成立一个单独的部门,而是散落在各个业务部门的单点研发中。
当年9月,京东成立了「AI 平台与研究部」,聚焦于 AI 技术探索,并陆续成立了一系列实验室,包括 AI 研究院、深度学习及语音和语言实验室、计算机视觉与多媒体实验室、数据智能实验室…到2018年年初,京东已经聚集了一批业内顶尖的 AI 科学家,如何晓冬、梅涛、郑宇等。
从2017年年底到2018年,这批科学家探索了许多夯实的 AI 基础技术研究项目,如大数据、优化算法、语音与语义识别算法,为京东奠定 AI 研究基础。
这几年,京东的 AI 团队在变化中不断壮大,如今,京东的 AI 能力以京东云为核心出口,对外输出。
大体来说,技术互联网公司可以分为三种类型:
第一种是卖基础产品,如微软,从磁盘操作系统(DOS)开始,然后到 Windows 与其他软件产品,成为一家软件为主的公司;
第二种是技术驱动,如谷歌,先基于搜索引擎技术做出的「谷歌搜索」(Google Search),没有作为单一产品卖出,后面才逐渐找到盈利的方法;
第三种就是业务驱动,先有业务需求(如卖货),再渐渐成型、建立起一个技术系统,如京东。
这也意味着,京东的技术研发必然与业务赋能捆绑。这甚至是所有 AI 科学家在加入京东时就了然于心的共识。比如,京东在2017年9月宣布成立AI平台与研究部的时候就明确提到, AI 研究与平台部承载着推动第四次零售革命中发挥重要作用。
京东的三个技术口号,实际上也各有侧重:
第一个技术代表了京东最基础、最朴素的需求,即如何提升京东现有业务(尤其是零售与物流)的效率。京东的自营模式决定其供应链涉及多个环节,不仅包括采购采销、运输仓储、服务交易,还有商品在平台上的展示、搜索、推荐与售后客服等。这一块以京东零售与物流为主。
第二个技术指可以标准化、模块化、产品化输出的通用技术,如云计算、智能客服,代表了京东向外链接千行百业的愿景。京东认为,实际上大量的行业都有与供应链相关的技术需求,例如金融与航空,所以第二个技术是基于第一个技术在内部的实践与沉淀来展开。
而第三个技术,是面向未来的基础技术研发,如过去十年以深度学习为代表的 AI。如今,这一块由京东探索研究院(2020年成立)、京东 AI 研究院(2017年成立)等团队主要承担,近年来以陶大程为代表对外发声的可信 AI、产业元宇宙等概念,均属于第三个技术对前沿的展望。
AI 研发在京东供应链的整体落地,也是沿着这三个技术排序走:
过去五年,1.0 时代,京东零售与物流打头阵,研发人员规模多达几千人,在京东内部的各个供应链环节都部署了 AI 技术,覆盖语音、文本、图像与决策。
有数据统计,在维持现货率 95% 以上水平的同时,京东通过智能供应链系统下发的采购单超过上亿条,内配自动化率达到 90% 以上。自营 SKU 超过 1000 万、全国 1400 个仓,也能将库存周转天数从90余天降至近30天左右,背后正是京东云的大数据与 AI 算法等技术的加持。
AI 与供应链结合的一个特点,就是摸索出产业对多模态技术研发的需求。以智能对话为例:
2018年7月,何晓冬带领深度学习及语音和语言实验室启动了一个叫「AlphaSales」的研究项目,后来对应的产品中文名就叫京小智。
与采购、计划、配送相比,客户服务被认为是供应链中最末端的环节。但实际上,京东当时每天接待数百万客户咨询、导购、服务等需求(现在已经超过一千万),智能对话的应用价值显然巨大。基于 AlphaSales框架,结合语音识别、图像理解、情绪理解、文字生成甚至序列决策(根据客户回复、结合上下文内容推断下一句生成的文字回复)等基础的 AI 技术,京小智大大改善了京东的客服质量与效率。
具体来说,供应链很长,分生产、流通、消费、服务四大环节,四大环节的基础上又可以细分出设计、定价、交付等十余个环节,人工智能技术也如此(非单一技术方向):
而当 AI 落地在供应链上,你会惊奇地发现:AI 是一项基础技术,可以应用在供应链的各个环节上;且 AI 在每个环节上的应用,都涉及到两个以上的单点技术。例如,在智能对话一环的语音、语言、图像、优化、决策,相互组合时,也是供应链中设计、生产、采购、运输、仓储管理等等环节的核心技术:
作为最早加入京东研究 AI 的参与者之一,何晓冬表示,在京东研究 AI,最大的感触就是:如果从供应链的角度看 AI 研究,AI 的应用范围和潜力都会被放大。AI技术的先进性也在被重新定义,供应链向 AI 提出了融合、多算法联合优化的需求,而非单点算法的进步。
在这样的背景下,京东的 AI 研究也不可避免地走向多模态融合,其技术成果也天然地具备为大多数行业服务的特质:标准化,模块化,端到端,全链条。
与许多大厂不同的是,京东招聘 AI 科学家,一开始往往就定了十分明确的 目标:技术商业化。也就是说,不仅服务京东内部的零售、物流、金融、健康等业务,还要基于服务内部所积累的能力走出去,服务千行百业。
这个目标使京东的 AI 团队在初成立时就同时扮演了两种角色:既是支持京东业务的子部门,也是京东内设的一个「AI 创业公司」。
京东的 AI平台与研究部刚成立时,也陷入过与其他企业 AI 研究团队雷同的「困境」:其他部门常常过来寻求 AI 算法的支援,但他们帮忙做了一年后发现,一方面业务提供的场景对 AI 技术的打磨很关键,但另一方面,针对业务定制AI技术往往做不成大项目,而且成本还很高。
例如,帮忙跟进的内部项目往往需要不断修改完善,十分消耗时间,对高人力成本的 AI 算法团队来说颇有点「大材小用」。另一方面,时间与精力被占据,也无法「创业」。
因此,从2019年开始,京东各个业务的定制化技术需求由其自建的研发团队负责,京东的 AI 部门不再接低ROI的商业项目,而是致力于研发高价值的、可以模块化、可复制的技术产品。
这就好比原来给屠宰场磨牛刀的铁匠,决心要自己单干,开了个工厂,聚集一批专注于打造武器的人,生产不仅能够用在屠宰场,还能用在战场、军事训练基地、龙门镖局等等不同场所的兵器武器,降本增效地将技术商业化。
何晓冬认为,技术的成功商业化是技术走向成熟的一个标志。
2020年,这座集中生产武器的工厂有一个新的名字:京东言犀人工智能应用平台(简称「言犀」)。言犀隶属于京东科技集团,可以看成是京东云的AI武库,聚集了京东过去在供应链各个环节的智能技术的积累,包括语音识别与合成、自然语言处理、视觉智能、机器学习、知识图谱、多轮对话、多模态智能人机交互、大模型等都汇聚其中。
依托京东云的技术底座,言犀开始走出去,服务政企、金融、航空、零售等多个领域,并取得了优秀成果。
以大同 12345 政府服务热线为例。在过去,12345 热线接到市民的诉求后,往往先把问题交到区级的分中心,再由各个中心派给相关街乡镇,一来一去,时间就会被拉长。
京东 AI 团队在之前京小智的实践基础上,,将多项成熟 AI 技术解耦出来、形成端到端的价值系统,在京东云上利用言犀平台打造了无数个「虚拟客服」,建设了一个数字化监管平台,数十万机器人智能体与900多万保定市民每日进行上万次人机对话,大幅提升相应效率。
据统计,2022年上半年,该数字平台共受理群众诉求960190余件次,同比增长122.78%,响应率100%,满意率由65%提高到97%以上,特别是在疫情高发的时候,支撑接起最高每天12万通市民电话,有力的保障了抗疫的需要。
这背后,体现的是京东云的供应链技术有效输出:过去支撑京东内部的 AI 技术,在经过高精、模块化的提取后,能够赋能外部企业,解决他们的数字化需求。
随着京东言犀的逐渐成熟,京东 AI 在技术的商业化上也形成了独特的模式,提出了「产业AI」的技术路径。
一般来说,内设于企业的 AI 研究院或 AI 部门往往陷入两种思路:一种是单纯服务于业务团队,造成业务先行、技术断后;另一种则是注重前沿探索,技术先行、业务随后。而京东的三个技术口号,分别在内部 AI(如京东零售)、产业 AI(如京东云)与未来 AI(如京东探索研究院)上都部署了实力深厚、同时相对独立的团队。
又由于京东的业务以本身对模块化要求非常高的供应链概念为中心,京东言犀的 AI 武器来源于内部技术成果积累,在对外输出时就相当于「一炼多用」,成本可控的同时效益倍增。2021年,何晓冬带领的智能服务与产品部在 AI 商业化上的收入就达到了数亿元,十分可观。
如今,智能对话技术已经成为京东 AI 的优势。
某种意义上,京东用产业AI 改变了供应链中的「服务」一环。但实际上,「服务」的概念远远大于「客服」。AI 技术是京东云服务产业的秘诀,但不是终点。
在赋能供应链的决心与理想中,京东云还有一个更大的野心:基于多模态融合的 AIGC 内容生产,重构供应链。
京东认为,AIGC 本质也是一种服务。
纵观各大厂,像京东这样大力倡导多模态 AI 研究的企业罕见,这也是为什么 AIGC 热潮兴起时国内大厂声量小的原因。根源在于,过去的十年,互联网技术大厂习惯从单点的技术突破(如语音识别,文本检索,图像感知)去开展研究,各技术组之间也没有相互打通,无法快速融合。
一位资深的 AI 从业者就告诉雷峰网,AIGC 在中国目前还未形成一个具体的赛道,一个很重要的原因是:人才稀缺。AI 领域视觉、语言、语音各大派各自为战,甚至视觉领域也出现人才两极分布的情况:识别与感知人才扎堆,生成人才却屈指可数。
但在京东,由于服务供应链的技术本就追求多模态、多算法间的融合,如果说早期的 AI 作画、AI 写诗只是牛刀小试,那么到京小智、工业品大脑和言犀平台,则不仅积累了丰富的跨模态研究经验,还让AI在自身数智供应链中生根成长起来。
以文案生成为例。京东APP上有一个「发现好货」的栏目,供应商每上新一个产品就需要写一段推荐文案。之前京东是发布任务,邀请写手、大 V 或 KOL 来写,但现在,这些任务可以用自动生成文案的「AI 写手」来完成。
格局再大一点:不仅是「发现好货」,实际上,京东APP整个页面所承载的数字内容,无论语音、文本与图像,都可以通过 AI 来自动生成。如同穿越科罗拉多高原,虽然还要跨过无数狭长高深的峡谷沟壑,但趋势已经十分清晰。
以京东最新上线的虚拟主播「灵小播」为例。在下图的页面中,文案、产品图、人物、动作、语音等,全都是 AI 自动生成的:
技术上看,这种可以可以察言观色,能带货的数字人主播是多算法协同的集大成者。在产业落地来看,商家不用再花大钱砸资源、找主播。
现在业界流行叫「人均一个数字人」,而对于京东云来说或许叫「店均一个数字人」。
这意味着,过去需要无数个化妆师、摄影师、主播、文案写手的行业,在未来可能只需一溜AI 算法就能完成,直接将供应链「闭环」了。对于数字产业的腾飞,不仅是降本增效的突破,而是迈进虚拟世界进行远程货物交易的可能。
从画鸟到画万物,无形之中,京东的科学家实现了AI技术的价值最大化——「之前我们都不知道 AI 画鸟有什么用,但你看,现在都用上了。」何晓冬笑道。
而那只「不会飞的鸟儿」一旦起飞,便会发现更多的可能。
声音、文案、图像、视频等数字内容实际上是许多现代商业活动的基础生产资料,因此一种新型资料生产方式的出现往往能带来一定程度上的商业模式变革,改变旧有的商业活动与游戏规则。
举个例子,直播带货对传统电商的冲击,本质是数字内容生产变革带来的影响之一。同理,AIGC 大幅降低数字内容的生产门槛,也有重构供应链的可能。
一个明显的例子是C2M(用户驱动制造)。在过去,消费品的生产是由厂家统一设计、生产,然后通过渠道分销。后来,厂家精准定位市场需求来指导生产的需求增加,C2M 平台。据统计,京东C2M智造平台已与数千个品牌达成合作,帮助他们节省了75%的产品需求调研时间,新品上市周期也比以往缩短了67%。
但在未来,当 AIGC 的技术足够成熟、设计的能力掌握在每个人的手中,消费者用 AIGC 技术设计产品外观与包装,再返回厂家生产制造,也不无可能。
高质量的内容生成往往也意味着高成本,导致整个市场高度集中在头部。而 AIGC 技术能大幅降低内容生产门槛,这也是 AIGC 的机会所在。
总的来说,没有一家国内企业的 AI 团队向京东一样,离供应链这么近。
从1.0时代的技术服务内部供应链,到2.0时代的技术走出去,京东的 AI 团队对一个词汇深有感触:产业 AI。
正如京东云事业群总裁高礼强在刚结束的京东云城市峰会上表示,如果说云技术在消费互联网的核心价值是解决高并发问题,在产业互联网则需要解决产业复杂场景高效协同。在数字化时代,这种产业发展和进化的压力,也将倒逼产业智能化和自动化,让AI真正成为服务万业的「大脑」。
就何晓冬来说,之前他在微软,更聚焦于单点技术的突破(如语音识别),不常将 AI 放到产业的大背景里去看。但沉浸在供应链的指导里后,很多思路会被打开。
比如京东近期开展的乡村振兴项目,要解决一个实际的问题,是如何将农民养的猪、鸡、鸭等生物资产变为可量化、可抵押的资产。在思考 AI 能做什么时,他们很自然地就会想到融合视觉、知识图谱等技术部署在仓库里,推智能云仓模式。
无论是零售、物流、营销服务领域,产业AI要实现的终极目标,一是最大程度优化供应链条上需要人来完成的工作,二是让AI的感知、推理和决策能力落地到分布于产业链条中的无数个细节之中。这一方面需要研究者们大胆探索和应用更新的技术,而这些细节场景也将成为产业AI新的「试验田」,成为彼此的新爆发点。
京东的 AI 团队很年轻,成立只有五年;同时,京东的 AI 团队又很老练,技术创新都恰踩在人工智能时代的前沿,多模态研究如此,AIGC研究亦如此。
将 AI 的门槛降低,服务更多行业,京东云已经迈出一大步。未来广阔高原,大有可为。
江湖再无锐迪科
单飞一年后 PICO 的爱与怕
留给快手海外业务的时间不多了
微信扫码关注该文公众号作者