字节跳动又整“硬”活儿了?
今天是Olina陪你的第3029天
第1859章
Olina
持续日更
努力的创业者
陪你一起在路上
机器人是典型的投入大、周期长的赛道。业内明星公司波士顿动力除了产品先进,另一个特点是30年没能盈利。2013年谷歌收购了波士顿动力,但仅仅四年后就转给了软银。
目前机器人比较成熟的应用是在工业制造领域。根据IFR、中国电子学会数据,去年我国工业机器人市场规模609亿元,为全球第一大市场,占据了全球45%的份额。但过去几年间,有关人形机器人的讨论也逐渐火热起来。
一方面一些互联网大厂纷纷入局,比如小米在去年推出了人形机器人“铁大”,特斯拉也在不断的更新自己有关人形机器人Optimus的进展。
另一方面,AI技术和加速计算的发展也让业界看到了人形机器人的机遇。英伟达CEO黄仁勋在ITF 2023上谈到“具身智能”的概念。简单解释就是给一个AI系统装上身躯,让他能够通过感知外界的环境去做出互动和决策。
虽然字节成功孵化了今日头条和抖音两款国民级软件,在软件领域被冠以“APP工厂”的称号,但其在硬件领域的尝试坎坷颇多,包括手机、教育硬件和头显在内的多次尝试均未取得满意的结果。这次踏入机器人赛道则说明字节对于硬件的渴望并没有停止。
这次讨论中,张一鸣鼓励团队不妨把目标定得大一点。
会上有机器人团队成员提出:机器人行业的商业化门槛是 1000 台,可以此为产业化目标的参考。一些参会管理层的反馈是 “1000 台有点少”:“为什么特斯拉要搞 100 亿台,我们只搞 1000 台?”
有管理层在这次讨论中提到,做机器人无非三种可能性:一是追求在技术山顶上插杆旗,就像波士顿动力那样做出一个技术领先的原型;二是用现有的相对成形的方案服务字节的内部需求;三则是用相对成熟的方案对外找客户,把规模做大。
总结这一轮讨论中字节管理层的想法,他们认为现在字节做机器人,应该:
跟已有业务做结合,服务好场景和行业;
探索大模型与机器人的结合,追求技术领先性;
对人形机器人的商业价值要进一步观察。像波士顿动力这种做了 30 年还不盈利的行为,可能不适合字节。
近期,字节机器人团队再次讨论了业务方向,目标更明确了,分为两大部分:
一是生产一些机器人,优先服务字节的电商履约需求;二是关注前沿技术,探索把 AI 大模型能力用到机器人上。
电商履约是指在电商交易完成后,平台把货物送到消费者手中的过程,它涉及仓储里的分拣、组货和打包,以及物流环节。
字节现在已建立了一些自营仓库,主要服务字节电商中的抖音超市,抖音超市占字节电商业务的比例还很小。字节想用机器人代替人类完成拣货、搬运和打包等过程。中国的人力成本现在不算昂贵,但使用机器人还有其它好处:它更能应对大促、爆品销量大增带来的短时间仓储工作量的大增。
由此推测,字节要做的机器人,可能是具备移动能力的、能在电商仓里送货的分拣机器人,以及带有视觉感知能力、能自己打包货物的机械臂。行业里,前者的对标产品有亚马逊的 Kiva,国内公司有极智嘉、快仓等;后者的对标公司有 Mujin(日本)、梅卡曼德、XYZ 等。
极智嘉分拣机器人在仓库中运货(左);梅卡曼德 3D 视觉辅助机械臂拾取包裹(右)。
它也有可能是一种新的产品和方案。据了解,字节目前还没有框定机器人的具体形态,形态最终取决于字节电商履约的需求。
字节目前并未确定今年制造机器人的具体数量目标。
机器人现在也被认为是 AI 大模型的重要方向,二者相互促进:大模型能为机器人带来 “常识”;与现实物理世界交互的机器人,则能为 AI 发展提供新类型的数据。
在这之前,字节对机器人的探索相对克制:2021 年开始,字节 AI Lab 旗下的机器人团队就曾尝试过做楼宇服务机器人,它可以在办公楼内送餐、送快递包裹;同时该团队也在字节之外寻找一些可能服务字节电商自营仓储物流的机器人,但大部分方案都不太成熟,“ROI 算不过来”。
从字节机器人团队的组织架构也可看到,它过去并不以业务为导向。2016 年成立的字节 AI Lab 目前分为两个大组:NLP(自然语言处理)与 Research,前者更多为字节的业务提供技术支持,而机器人属于的 Research 组,并不直接支持业务。
2019 年以来,字节也陆续投资了一些机器人公司。如扫地机器人公司云鲸智能,前发那科副总经理沈岗创立的盈合机器人,服务仓储物流的迦智科技、炬星科技和未来机器人等多家公司,涵盖家庭清洁、配送、物流、工业等多个领域。
从左至右分别为云鲸智能、炬星科技和未来机器人的产品。
这些机器人公司大多成立于 2017 年前后,共性是研发针对特定场景、解决特定问题的机器人,它们的产品因而形态各异。这是因为在此前一段时间的技术限制下,机器人无法做到真正通用,比如同一个机器人既能在工厂搬零件,又能送外卖,甚至帮你洗水果、切菜。
特斯拉在 2021 年宣布 Optimus 擎天柱人形机器人计划后,行业风向开始改变。
Optimus 的目标是让人形机器人替代人类完成一些危险、重复和无聊的工作。在特斯拉的演示中,Optimus 已能浇花、收拾桌子和搬运物品。今年特斯拉的股东大会上,马斯克说未来人形机器人的需求是百亿台,可能还不止。
特斯拉 Optimus,与目前大部分采用轮式移动的机器人不同,Optimus 采用了双足设计,看上去更像人。
在马斯克的大胆计划后,大模型技术进展又为行业添了一把火。一些人开始相信通用机器人可能比预期中更快到来。
今年 5 月的 ITF World 2023 半导体大会上,英伟达创始人、CEO 黄仁勋在演讲中提到,人工智能的下一个浪潮将是具身智能(embodied AI),即能理解、推理、并与物理世界互动的智能系统。
海内外的科技公司也都在尝试把参数规模更大的 AI 大模型与机器人结合,打造更通用的机器人。
OpenAI 在今年 3 月投资了一家挪威人形机器人公司 1X Technologies,这家公司正在研发人形机器人。
1X Technologies 已开发出了轮式双臂机器人 EVE(左),它的手部使用了双指夹具(中),它们正在研发双足机器人 NEO(右),从概念图看,手部会采用灵巧手。
今年 6 月,Google 旗下 DeepMind 发布了 RoboCat,把大模型的能力应用到了机器人上,DeepMind 科学家 Alex Lee 在接受 TechCrunch 采访时说:“我们证明了一个单一大模型可在多个机器人实体上解决多样化任务,并且可以快速适应新任务和机器人实体。”
DeepMind RoboCat 的演示,在学习人类动作 1000 次后,机械臂可以完成物体分类和拾取。
今年以来,腾讯 RoboticsX 机器人实验室也把 AI 模型应用到了机器狗上;在阿里巴巴的通义千问大模型的支持下,用户可在钉钉对话框直接以自然语言输入命令,远程指挥机器人。4 月,小米成立北京小米机器人技术有限公司;6 月,华为成立 “极目机器”,布局机器人与智能制造。
新一轮热潮中起步的机器人项目和公司能坚持多久,还有待验证。建立一个机器人团队并稳步推进研发工作,需要巨大的投入,更大挑战是训练机器人的数据比训练一般软件 AI 系统的数据要稀缺得多。
OpenAI 首席科学家伊利亚·苏茨克维(Ilya Sutskever)今年 4 月接受采访时,被问到 OpenAI 放弃机器人是正确的决定吗?他说 “是的,我们那时真没办法继续研发机器人了”,如果要搜集优化机器人所需的数据,需要有一个庞大团队来制造并维护机器人:“制造 100 台机器人已是巨大投入,但即使如此,你也不会获得很多数据。”
字节过去在硬件上的尝试,并不如它的互联网应用那样成功,大力台灯和 VR 头显 PICO 是先例。大力台灯已不再发布新品,一度 1000 人的团队至少有一半离开;PICO 今年一季度也经历裁员,并下调 2023 年销量预期至 50 万台,比 2022 年的实际销量缩水 50%。Meta 的 Quest2 2022 年销量则超过 700 万台。
字节不缺资源,它过去擅长大力出奇迹:定下目标后,调动人力、资金等全部可用力量在短时间全力冲击。但硬件行业和前沿科技有另外的逻辑,它考验耐心、韧性与认知,需要更长期的等待与坚持。
从此前的公开信息来看,字节对机器人的踏足并不突然。从2020年开始,字节就针对机器人赛道出手多次,一年半内投了多家公司。其中既有主打家庭服务场景的云鲸智能,也有专注物流机器人的迦智科技,还有专注于工业视觉AI的崧智智能,当时业内便有猜测,认为字节的一系列的操作是在为补齐抖音电商的短板做铺垫。
不过过去两年,字节并没有显露出下场做机器人的兴趣,根据相关媒体报道,字节的机器人属于的 Research 组,并不直接支持业务。
而这次选择躬身入局,或许主要出于内外两个方面。
一个很明显的体感是机器人,特别是人形机器人的热度在大大提高。
除了前文提到的小米、特斯拉,华为也对机器人表现出了浓烈的兴趣。根据公开消息,今年6月20日,华为8.7亿元注册成立全资子公司东莞极目机器有限公司(下称“极目机器”),公司董事长、法人代表为李建国,他同时也是华为常务董事、制造部总裁。早在2020年华为就在全球5G大会上秀出了自己人形机器人。
大厂们之所以纷纷入局机器人赛道,和它的远景密不可分。一方面,AI技术包括多模态大模型技术、PaLM-E模型以及加速计算的发展让人们相信,具身智能可能将是AI的终极形态,而人形机器人是实现具身智能的最佳形态之一 。未来人形机器人可以实现根据外界的信息去交互和决策。
另一方面,由于结构设计接近人体,人形机器人的活动场景可覆盖人类活动的方方面面,可应用于家用、商用、工业多个场景,特别是陪伴等服务型场景。浙商证券预测到2026年,智能服务机器人的全球市场规模有望达到67.6亿元。特斯拉CEO马斯克则表示,未来人类和人形机器人的比例将不止是1:1,全球80亿人口为基数上,未来人形机器人可能超过人类数量,渗透率的天花板高且想象空间大。
政策层面,今年1月,工信部等十七部门联合印发《“机器人+”应用行动实施方案》,聚焦制造业、农业、建筑、能源、商贸物流、医疗健康、养老服务、教育、商业社区服务、安全应急和极限环境应用等10大应用重点领域,提出明确指引方向;今年6月,上海、北京接连出台了机器人行业支持政策。
中信证券称OpenAI、腾讯、小米、谷歌、英伟达等科技企业持续加注机器人领域,推动机器人技术创新与落地进程加速,机器人发展“硬件先行”,模组化零件为未来发展趋势,零部件厂商一体化布局提供整体解决方案,同步提升产业链地位,推动机器人产业降本增效与规模化落地。
对于大厂们而言,需要在浪潮来临之前做好准备。
对于字节本身而言,围绕抖音做商业化是主要任务,核心业务抖音电商需要加强货架部分的建设。在 2023 抖音电商生态大会上,抖音电商总裁魏雯雯表示:“我们希望未来货架 GMV 占比至少达到 50%,从流量增长的角度,我们对这个判断非常有信心”。
事实上,从今年618的表现来看,直播电商总GMV的增速从去年的124%降到了今年的27.6%。在猫狗持续加强内容和低价心智的情况下,抖音也需要加强货架的建设,弥补自身不足。
此前,京东物流(昆山)亚州一号智能产业园官宣完成第100亿件智能包裹的分拣,正式成为全球规模最大仓拣一体智能物流园区。下场做机器人,显然也有助于字节补齐自身电商业务短板。
2007年的iPhone发布会上,乔布斯引用了图灵奖获得者Alan Kay的一句话:真正在意软件的人,应该自己造硬件。
在硬件领域,字节称得上屡败屡战。
2019年,字节把目标指向了教育硬件,并把这件事交给了阳陆育负责,直接向教育业务负责人陈林汇报。
对于教育硬件,字节寄予厚望,不仅把收购来的吴德周率领的锤子硬件团队并入其中,还打出大量优惠,阳陆育表示,“硬件不赢利是在我们的预期之内,硬件是不赢利,我们是亏钱在卖。”不过随着相关行业政策的出台,裁员成为了教育部门的主旋律,此前卖了一百万台的智能台灯也停止了迭代。
2021年,字节把目光投向了VR,并斥资数十亿从腾讯手中截胡了头显厂商Pico。但由于VR的硬件体验距离成熟还有相当距离,购买者嫌少,而缺乏出货量则会导致内容生态的缺失,这使得整个市场几乎处于一个悖论。IDC的最新报告显示,今年一季度全球AR/VR头显出货量同比下降54.4%,在此背景下,PICO 也调低了今年的销量预期。
在机器人领域,字节不再大力出奇迹,而是更加审慎。根据《晚点LatePost》报道,字节机器人业务的方向主要有两个,一是生产一些机器人,优先服务字节的电商履约需求;二是关注前沿技术,探索把 AI 大模型能力用到机器人上。
正如前文所提到的,机器人是一个典型的投入大、周期长的赛道,根据各路券商的研报,当下机器人仍处于0到1 的革命中,对资金、技术、资源整合的要求都比较高。一些知名厂商生产的人形机器人成本非常昂贵,波士顿动力Atlas的单台成本为250万美元,特斯拉的Optimus成本约10万美元。
因此当下更重要的是结合自身需求去做推进。除了电商业务,字节在今年也加入了大模型之争,6月初,根据相关媒体报道,字节跳动正内测一款 AI 对话类产品,其代号暂时为“Grace”,目前已处于“测试完善”阶段。随后字节回应,Grace”是一个 AI 对话类测试项目的内部代号,目前仍然处于初级阶段,且仅供内部体验测试。
过去利用算法,字节在信息分发领域的打法近乎是高维打低维,走位风骚,打法奔放。这在硬件领域显然行不通,不过也不足以打消字节对于硬件的渴望。
前段时间,特斯拉人形机器人的出现爆火了一波,如今字节也开始“捣腾”机器人,后续市场反馈如何还有待时间验证,但无论如何方向是对的:用机器人替代人类工作,应对大增的仓储工作量。
可以说,极强通用性的人形机器人将是机器人界的iPhone,类比自动驾驶,通用机器人不需要完全通用才有商业价值。
根据相关报道,美国当前最低时薪7.25美元,即便只替代最基础的岗位,人力成本也将大幅下降。根据莱特定律,产量从一到十的过程中,生产成本会有三次15%左右的降低,最终生产成本会降到原来的60%左右。
过去大多数时间里科技进步是线性的,摩尔定律将其变为了指数级。从1958年半导体的发明到2022年已到达古印度舍罕王故事中“棋盘的后一半”。
那么,人形机器人的“超魔力”是什么,值得关注。
人形机器人核心部件
众所周知,力传感器与编码器是人形机器人的核心部件,其中力传感器感知并度量力,在人形机器人关节上具有应用,编码器可测量旋转角度与速度,可通过伺服系统应用于人形机器人中。
从竞争格局来看,高端编码器与多维力矩传感器由于技术壁垒较高,国内可量产的企业较少。
开源证券孟鹏飞等人6月26日研报表示,高精度传感器作为现代工业发展的重要基础,其在消费电子、汽车、工业等领域具有广泛应用。由于高精度传感器具有显著的技术壁垒与制造壁垒,国内高精度传感器严重依赖海外进口,海外“卡脖子”现象比较严重。在政策催化下,高精度传感器的战略地位有望不断提升,本土替代或将加速推进。
据了解,力矩传感器又称为扭矩传感器,可对各种旋转或非旋转机械部件上对扭转力矩感知的检测,能够将扭力的物理变化转换成精确的电信号,具有精度高,频响快,可靠性好,寿命长等优点。
按照测量维度,力传感器可以分为一至六维力传感器。六维力传感器是目前维度最高、力觉信息反馈最为全面、难度最大的力觉传感器,最早应用于航空航天市场,后逐步应用于打磨、铣削、焊接及装配场景的工业机器人以及对传感性能要求更高的协作机器人。
值得一提的是,一台进口的六维传感器价格接近国内一台协作机器人的价格!
特斯拉人形机器人“护城河”是什么?
人形机器人是人工智能的载体,是一个“输入-计算平台-输出”的过程,过去机器人仅有“输出”,新的产品定位和商业模式下,有业内人士看好特斯拉实现人形机器人梦想,他们认为本质逻辑为其具备完成商业模式闭环的能力,以核心软硬件自研+低成本、规模优势的供应链为护城河:
1)FSD视觉感知算法可以在机器人上复用,并以智驾领域积累的Know-How进行赋能,未来FSD V12、Dojo超算落地将大幅提升AI训练速度;
2)电车供应链直接迁移(传感器、电机、减速器等),规模化降本能力强(具备硬件制造、降本能力);
3)自有工厂创造应用场景,以机器学习+大量数据的方式,在真实的场景不断训练-优化机器人。
据了解,特斯拉机器人Optimus躯干关节有28个执行器(旋转14+线性14),手部有12个执行器。旋转关节:采用旋转式驱动器,主要由无框力矩电机+谐波减速器(有可能部分替换为行星)+力矩传感器+编码器构成;线性关节:采用线性驱动器,主要由无框力矩电机+滚柱/行星滚珠丝杠+力矩传感器+编码器构成;手部:每个手有6个驱动器,主要由空心杯电机+精密行星齿轮箱+力矩传感器+编码器构成。
微信扫码关注该文公众号作者