Redian新闻
>
大模型元年,万能的淘宝有了万能AI

大模型元年,万能的淘宝有了万能AI

公众号新闻
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

今年双十一,除了买家卖家和平台,还多了第四种参与者:

AI助手。

淘宝天猫平台,商家在双十一准备期及开卖期调用AI次数已超过15亿次。

买家方面,AI助手淘宝问问的累计体验人次也超1000万,其中高活跃人群日均提问数超8次。

最夸张的一条数据是“单一用户最多提问数超4000次”,这位是完全不动手找商品,买什么全听AI的了吗?

淘宝天猫这回各种AI应用,那是百花齐放。

不知道买什么可以问AI,具体选哪款可以问AI,选好了怎么下单哪些活动实惠还可以问AI。

这还没完,卖家快速开新店可以找AI,大批量上架商品可以找AI,投放广告还是可以找AI。

……

大模型爆发接近一年,不断改造着人们的工作和线上娱乐方式。

而渗透进电商购物这一块,可以算是连接上了空间更为广阔的衣食住行等线下生活。

AI购物新体验

AI助手淘宝问问,已经对所有淘宝用户开放,直接在搜索框输入「淘宝问问」就能直达

乍一看与其他聊天机器人产品类似,主体都是一个对话框。

实际上手体验才发现,它不仅懂商品,还懂你。

如果有优惠券要凑满减,就可以让AI推荐点凑单的零食。

无需在提问时附加额外的要求,它也能从历史订单、购物车等数据中推荐符合喜好的商品。

对于每款推荐的商品,AI都会总结好产品本身的特点、适合的人群或场合,以及推荐理由。

接下来点击商品卡片,就可以直接选择规格、口味加入购物车了。

除了直接提问,在淘宝问问里有一些内置好的功能模板。

「用我挑商品」专治选择困难症,选择两个商品优缺点对比说的明明白白。

「婚礼策划师」与「旅行策划人」、「资深导购员」都是专为相应场景优化,整体方案+每个环节商品推荐一口气呈现。

「生活小能手」和「美食达人」,在解决日常问题的基础上又可以一键购齐所需材料。

最后「灵魂写手」则是给喜欢分享购物体验的用户准备。

这里展开介绍一下「用我挑商品」对比商品的玩法:直接从浏览记录或购物车中选择两件拿不准的商品。

即使是不同品类的洗衣液和洗衣凝珠,AI都能帮你把异同分析得头头是道。

当然如果是要对比衣服,到底怎么搭配好看,淘宝问问暂时还帮不到你。

这时候就要请出另一个功能「淘宝试衣了,还是直接搜索就可找到。

看好哪件点一下就可换装,可自己搭配上装下装或选择套装,堪称真人版奇迹暖暖。

涉及要与发型脸型体型腿型各种型搭配的,还可以上传自己的全身照片、设定自己的身高体重来代替AI模特,不出门不花钱就能在线试穿上千万种。

可以点击对比按钮,与自己拍照时的状态反复对比,也是很实用的玩法。

除了上面展开介绍的这些,淘宝天猫还准备了「我的萌宠,通过AIGC技术为你的宠物制作数字分身;「极有家,上传房间照片,在线设计装修方案等更多玩法。

都是在搜索栏搜索直达,篇幅有限,就留给感兴趣的读者自己去体验了。

商家也有了专门的「淘宝商家智能经营工具」,从上传第一个商品照片开始,店铺起名、生成Logo、仅靠张图片自动识别商品属性、上架、到店铺装修,一气呵成,节省大量人工操作。

此外还有商品素材任意扩展尺寸功能,适应各种展示场合,大幅降低素材加工成本,避免人力返工。

最终从复盘数据来看,今年双十一是新品牌、新商家、中小商家参与最多的一届。

按往常来说,对于平台功能不熟悉、操作不熟练会带来不少麻烦,但今年在新技术的加入下,彻底把经营店铺的门槛降低了。

淘宝商家智能经营工具线不足半月,就为女装服饰商家提供了10w+次AI发品服务,发品时长较传统发品降低25%。

基于大语言模型技术研发的中心化电商经营Copilot,开启内测后也为数万商家提供了经营知识问答、经营工具调用、文案生成等多种经营辅助能力,目前已经为商家经营提效超50w次。

AI技术在电商领域的首次大规模应用

算起来,ChatGPT发布接近一周年,AIGC文生图的兴起还要更早一些。

这期间每一次技术突破,都掀起一波创业或改造已有业务的浪潮。直到今年双十一期间,AI在电商领域终于实现大规模应用,意义非比寻常:

不仅用于企业内部流程,还要面向终端用户。而且是一次面对买家和卖家两种特点、需求都截然不同的终端用户。

这其中涉及大模型和AIGC文生图两大技术路线的融合创新,可以观察到AI如何跨越从技术到应用的鸿沟,也能为更多行业带来启示。

先说更早兴起的AIGC文生图。2022年8月Stable Diffusion开源、算力需求小,开启了AIGC商业化的序幕。

但Stable Diffusion的弱点也很快在实践中暴露出来:

首先是生成的图像不可控问题,特别是淘宝天猫所在的电商领域,对商品主体的呈现准确性要求极高。

其次是使用复杂,复杂的提示词技巧就不好掌握,众多需要调节的参数更是增加了学习成本。

转机很快出现。1月份,ControlNet横空出世,巧妙的通过添加辅助条件引导生成,一定程度上解决可控性问题,被誉为“改变游戏规则”。

这时,高手已经可以用Stable Diffusion+ControlNet的组合来指定生成图像的细节了,如人物姿态、整体布局等,相当于提升了AIGC文生图的上限。

但对于淘宝天猫要服务的众多普通用户而言,这些引导方式的理解和使用成本依然很高。

23年8月,一项新技术IP-Adapter出现,再次把稳定按需生成图像的门槛降低。

IP-Adapter相当于开辟了“用图像当提示词”的新方法,也可以当成ControlNet中的一个引导条件。

这样一来,电商卖家在文生图流程中利用好现成的商品照片即可,无需再学习掌握提示词技巧或其他专业制图知识,相当于进一步降低了AIGC的下限。

解决了基本的实用性问题,更深层次的需求又凸显出来。

Stable Diffusion属于预训练模型,对世界的理解主要来自训练阶段的数据。

而电商领域又是快速变化的,每天都会上新大量商品,需要AI能不断更新、持续学习。

这时,来自大语言模型的快速微调技术LoRA就派上用场,借鉴到AIGC文生图领域被当做“知识/概念注入”的方法。

具体来说,LoRA在微调时会冻结模型的大部分权重,仅更新一小部分。同时更新后的权重还可单独分离出来,每个只有几十到上百MB大小。

在淘宝天猫的实践中,LoRA相当于为商品和模特构建了数字分身,为商家沉淀数字资产,可以进一步生成更加丰富多样的商品或模特图。

把LoRA加入流程后,又出现生成可控比较差的问题。如何让LoRA生成的模特在像与美之间取得平衡,如何让基于LoRA生成的商品精准还原商品细节,都是需要进一步解决的应用挑战。

此外淘宝天猫还在探索不用训练即可将商品概念用于图像生成的全新知识注入技术,直接在推理阶段提供商品图片即可,极大降低知识注入技术的应用成本,提升实时性。

AIGC要大规模应用,光是围绕图像生成模型Stable Diffusion本身的增强改造就有这么多。

但实际工作流程中,为了大幅降低生图操作的复杂度,还有大量工作需要完成。

比如针对电商领域对商品主体必须准确呈现的需求,又加入了SAM分割万物分模型,先把商品主体分离,再与AI生成的环境背景部分适配融合。

这样一来确保了商品主体的准确呈现,避免出现“货不对版”,又能使商品主体与背景无缝融合, 让光影看起来没有破绽,有放置物感。

接下来还要结合局部细节修复、超分辨率、增加滤镜等多个环节提高图像质量,达到商用级别水准。

AIGC应用如此,大模型在电商领域走向大规模应用的历程同样困难重重。

特别是淘宝天猫要做的不是纯粹的专业模型,而是一个有很强专业领域能力的通用模型,以解析淘宝用户长尾的自然语言问题,理解更加精准的用户意图。

要实现这一点,在通用模型的基础上首先要增加电商专业知识,在多年积累的电商行业数据中训练。

但此时通用大模型还在根据输入续写文本,比如当用户提出一个问题,模型很有可能按格式补充多个类似问题,而不是回答这个问题。

行业中解决这个问题的方法AI与人类偏好对齐。SFT(指令微调)让大模型学会如何完成用户的指令,RLHF(人类反馈强化学习)让大模型学会什么样的回答满足人类偏好。在淘宝天猫的实践中,产品上线后还能不断迭代用户的反馈偏好。

接下来要解决的是大模型回答中的,业内称为“幻觉问题”。对此,淘宝天猫技术团队从模型内外两方面,双管齐下去解决。

模型内,也就是在模型训练阶段就引入大量电商行业数据。

模型外,通过RAG(检索增强生成)技术,针对不同的问题,调用不同的知识库,获取实时更新的商品信息。

更进一步的,针对需要实时调用外部工具的问题,淘宝天猫技术团队利用Tool learning技术,优化大模型理解工具、选择工具和调用工具的能力,并提供可解释的工具调用路径,使回答内容更准确,回答形式更加丰富。

比如淘宝问问里用户的一次普通查询,不仅调用了大模型生成能力,还调用了淘宝商品推荐能力和内容社区的视频推荐能力。更复杂的场景如旅行策划,还会调用合作伙伴飞猪的机酒预订能力。

最终,以淘宝问问为代表的一系列大模型产品,在大模型基础上有意图识别、任务规划、记忆和使用外部工具能力,正朝着Agent(智能体)的方向发展,也就是大模型行业必争的下一个阶段。

双十一大考,AI成绩如何?

以往每年双十一,对技术、工程来说都是一轮大考。今年对AI的加入来说,更增添了一层初次实战检验的味道。

现在,淘宝天猫集团这一波AI成果,是不是也代表着一些明确的新趋势?

首先,AI技术创新拓展了电商的边界,增加了可能性。

购物从需要明确知道要买什么,去搜索。变成了只要有需求,都可以询问AI。

即使之前不知道该买什么或者根本不认为能通过购买商品解决的需求,都可能由AI为你推荐出来。

其次,AI技术创新改进了商家的工作方式和生产效率。

与买家的情况相似但又不同,卖家被AI推荐的则是后台功能、经营工具。

以往商家使用淘宝天猫商家后台的千牛工作台,有不低的学习成本,功能太丰富,很多不知道在哪,甚至不知道某个功能的存在。

AI加持下,也变成了店铺经营过程中有任何需求就可以找AI,让AI定位到合适的功能,或通过RAG技术解答商家的问题。

最后,双十一虽已过去,但大量与AI交互留下宝贵的经验和数据。

淘宝天猫集团本就拥有完整的电商行业数据、行业经验,并凭借其打造出规模化的AI产品,双十一期间产生大量用户反馈数据,又可以再投入到算法改进,最终形成滚雪球效应。

OpenAI开发者日标志着AI行业越来越卷,YC创始人Paul Graham给提出建议,若要在竞争中不被淘汰,需要做到:

  • 不仅依赖AI,还依赖于特定领域的深厚领域知识

  • 与终端用户建立非常密切的关系

而这两点,恰好也是淘宝天猫集团天生所擅长的。

在AIGC行业有个说法,“AI一天,人间一年”,期待明年618、双十一,AI又能给我们带来什么购物新体验。

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
"裸尸成了万圣节装饰"美现夸张命案!干痒皮、敏感肌的宝宝有救了!消红止痒快,滋润保湿强,秋冬3管起囤全红婵再度夺冠,郭晶晶的遗憾戳破了万千父母不想承认的真相清华系大模型新秀获20亿投资;AI教父加入初创公司;套壳ChatGPT不是长久之计;百图生科拿下10亿美元大模型订单北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型NUS、NTU团队发布医疗大模型综述,全面介绍大模型在医疗领域的最新研究进展工作着是美丽的吗?站上大模型制高点:我们给不输GPT-4的文心大模型4.0,来了一场技术揭秘Erich Segal [love story], why famous?大模型改变世界,这家公司改变大模型免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug上海青浦大观园CES 2024丨全场馆卷起AI硬件海啸,大模型迎来落地元年李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型想被「救赎」的年轻人,养活了万亿疗愈经济UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源打通产业链,AI能让500亿的淘客行业迎来新爆发|专访粉象生活AI负责人觉晓1岁婴儿长了张35岁中年男人脸??在网友质疑中成了万粉网红……AI公司第四范式IPO上市;雷军王小川联手搞小米大模型;百度发布量子领域大模型;AI新技术90秒识别癌;苹果疯狂购买AI初创公司想被“救赎”的年轻人,养活了万亿疗愈经济小说:兰欣与乌茶 33科研上新 | 第2期:可驱动3D肖像生成;阅读文本密集图像的大模型;文本控制音色;基于大模型的推荐智能体有钱也不是万能的!重磅!加拿大最法院首次判例:移民部可以英语不好为由拒签移民,学签、工签等...科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新Cos李佳琦,那英和安陵容火了!中国人重新发明了万圣节餐饮创业,80个城市的淘汰率2024,万众瞩目的行业大模型如何落地?万能的白色器皿AI的大模型时代 ≠ 只有大模型的AI时代小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大被无情的淘汰了旅美散记(21):韩国大学生球友Brandon「简报」Shapiro 州长访问卡耐基梅隆大学——人工智能的诞生地,签署关于生成式人工智能的行政命令;拓展:以新方式建模神经元20辆汽车一夜之间遭破坏|小心!盗贼们盯上了万圣节饰品|肯尼迪脱离民主党,在费城宣布独立竞选|巴以战争升级,哈马斯是什么?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。