三年后美国所有汽车餐厅都不用人接单了?接地气的AI来了……
你好,我是王煜全,这里是王煜全要闻评论。
随着生成式AI进入展开期,越来越多的企业将自身业务与大模型相结合,有些公司喜欢标榜自己有高大上的黑科技,有些却十分接地气。
7月29日,大名鼎鼎的谷歌DeepMind发布了一款机器人模型Robotic Transformer 2(RT-2),号称机器人版的GPT。它是一个单臂机器人,不仅能理解人类提出的要求,还能进行简单的推理,最终完成指定任务。
如果把狮子和恐龙两个玩具模型摆在它面前,让它“捡起已灭绝的动物”,RT-2会准确地选出恐龙;它还能在三张人类照片中选出Taylor Swift的照片,并把一罐可乐放到上面。
以往的机器人需要非常直接的指令,而RT-2却可以理解灭绝动物的概念,然后再与恐龙玩具联系起来,最终选出正确答案,看起来是有了简单推理能力。
DeepMind为驱动RT-2的模型取了一个高大上的名称,视觉-语言-动作VLA模型,简单地说就是让机器人更好地识别视觉信息,解释人类的自然语言指令,并作出相应的行动。不过,它最大的升级是嵌入了谷歌的一系列基础大模型。
为了宣传RT-2的研究成果,谷歌发布了演示视频和说明文章,众多媒体开始转发,说这是AGI机器人的大招,是又一个AI大模型黑科技。
RT-2确实有进步之处,将大模型技术与机械臂相结合完成了相对复杂的任务。这也是我们之前在科技特训营里预测过的,大模型的下一个大机会就是和机器臂结合,使得机器臂能听懂人类指令,并能实现人类才能做到的复杂操作。
但问题是,今天RT-2看上去很黑科技,赚了不少眼球儿,却与离走进人们的现实生活至少还有几年的差距。
相比之下,另一个AI应用显得土里土气,却已经进入到人们生活中了,它就是美国公司Presto的AI语音点餐助手Presto Voice,主要应用场景是汽车餐厅(drive-thru),也就是俗称的“得来速”餐厅。
在传统的“得来速”餐厅中,客人可以把车开到点餐窗口与人类服务员对话点餐,之后在取餐口取餐,全程不用下车。
这种餐厅不仅方便快捷,更重要的是成本低,所以美国很多快餐店都会采取这种模式。麦当劳的美国餐厅中,“得来速”餐厅占到了70%以上的利润。
Presto Voice精准的选取了“得来速”餐厅的点餐环节,他们基于OpenAI的GPT模型,开发了生成式AI语音助手,代替人类服务员来为客户点餐,之后再由人类服务员完成后续工作。
他们在餐厅落地的设备看起来很朴素,一个普通的铁皮音箱,搭配几个灯箱来展示菜单,完全没有黑科技的味儿。
不过,美国已经有350家快餐店部署了Presto。这家公司的CEO Krishna Gupta认为,三年后美国所有汽车餐厅都不用人接单了,因为Presto 能够在没有任何人工干预的情况下接管95%以上的订单,不仅可以降低人工成本,还能让单店收入增加6%。
为了验证Presto的可行性,《华尔街日报》记者Joanna Stern驱车赶往马里兰州肯特岛的一家Hardee's汽车餐厅,做了三项测试。
她先测试了Presto的语音识别能力,看它在不同噪声下能否准确的识别客户语音,结果Presto在狗叫和儿童吵闹声的干扰下,都生成了正确的订单。
之后,她又在点餐时临时更改订单,用来测试Presto Voice自然语言处理能力。她一开始说想要Hardee汉堡套餐,Presto就问她想要中号还是大号,Joanna却说“对不起,我想要加奶酪的superstar汉堡了”,结果点餐还是成功了。
另外,Joanna还测试了人性化服务水平,因为她在“得来速”点餐时喜欢和服务员闲聊几句,她问Presto Voice喜欢Taylor Swift哪首歌时,并没有收到回复。
这是因为,虽然Presto使用了OpenAI的技术,但是与GPT用全网数据训练不同,Presto只用了与餐厅有关的有限数据集进行训练,如果点了菜单上没有的金枪鱼卷,它会说对不起,餐厅不供应这个菜品。
这与我们打造“AI王煜全”时的思路不谋而合,“专业问题更专业,非专业问题不回答”。我们并不是用大模型直接提供服务,而是在模型基础上,用我在科技特训营3年来积累的600万字语料进行训练,这样的好处是既提升了用户体验,又保证了专业性。
尽管有些问题没得到回复,Joanna仍然认为Presto的服务效果很好,她认为这是发生在餐厅中的人工智能革命,这让她开始担心美国330万从事快餐或柜台工作的人,是否会因此失业。
不过,Hardee连锁店的负责人却觉得没必要担心这个,原因在于他们并不想裁员,有了Presto,员工就可以做其他事情,比如照顾餐厅里的客人,这无疑缓解了用工短缺问题。
有的员工认为,不再与顾客沟通实在是一种解脱,尤其是他们早就厌倦了在点餐结束时不得不询问是否要追加订单;一些顾客则表示,总算不用和脾气暴躁的快餐店员工沟通了,感觉也挺好的。
你看,AI使数字革命进入了成熟期,但不同的机会会在不同的阶段陆续出现。同样是使用大模型技术,DeepMind在为未来的机器人革命做准备,而Presto已经在改变人们的生活了,其中的关键就是我一直提到的,这一轮AI技术首先催熟的是自然语言互动。这类AI应用已经进入展开期了,需要从现实需求的角度来具体探索应用模式了。
从这一点上说,Presto对广大创业者有一定的借鉴意义,证明了生成式AI的实际应用价值,但是,Presto还没有实现高端化、个性化与持续化,也就尚未发挥生成式AI的真正价值。我们期待更多创业者参与进来,探索出更多接地气的商业模式。
以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!
王煜全要闻评论,我们明天见!
1. 前哨科技特训营直播课程第四季(2023年)共50讲+,除此之外还有5节加餐+公开课。 2. 每讲承诺为1小时视频内容,实际平均时长为2小时。 3. 每周四晚八点准时直播,会员可无限次观看回放。 4. 新入会员,可以无限次回看之前所有视频课程。 5. 成为会员即可使用【AI王煜全】,最新AI大模型开发的专属科技分析助手
6. 每周组织【前哨·创新启发局】,链接科技/产业一线人士,打开技术/应用前沿视野
7. 优先获取全球科技产业一线游学、访问机会,接触科技/产业专家,获取最新、最前沿的趋势洞察,人脉链接
8. 本课程为虚拟内容服务,年费订阅服务制。一经订阅概不退款,线下活动需另行支付差旅成本,请您理解。
微信扫码关注该文公众号作者