华为“天才少年”彭志辉(稚晖君)2023年3月成立智元机器人,1年时间里获得5次融资,最高一次获得了超6亿元,比亚迪是投资方之一,它希望引进智元的机器人革新某些生产工艺;另一位天才杨植麟是月之暗面的创始人,在今年2月完成10亿美元的融资,创下大模型融资新纪录,月之暗面推出的Kimi火爆网络,月活用户达到百万,但杨植麟预测,大模型更多有价值的突破会产生在工业界;英伟达CEO黄仁勋2023年10月以3200万美元领投了一家机器人公司,这家公司试图用机器人技术和人工智能的最新进展来建造下一代工厂。除了创立了英伟达,黄仁勋还是个顶级科学家,今年年初,他当选美国工程院院士。传统工厂确实太老了。距离1913年福特发明流水生产线已过去110年;就连雷军造车引以为豪的“工业机械臂”也是在1954年就发明出来了;马斯克曾设想建全自动化的超级工厂,但遭遇了产能陷阱,他不得不与自己妥协。ChatGPT兴起,机器与人的界限被打破,旧有的生产体系满足不了具身智能的生产,它呼唤新的工厂体系。需求从市场规模的持续增长也能窥见一二。据市场研究机构Mordor Intelligence数据,2023年全球智能工厂市场规模估计约为3231.3亿美元,预计到2028年将达到5142.9亿美元(约合37204亿元人民币)。比稚晖君和杨植麟更早,来自香港中文大学的终身教授贾佳亚更早看到智能制造的未来。贾佳亚是CV(计算机视觉)领域的顶级科学家,2019年从腾讯离开后,贾佳亚成立思谋科技,即“Smart More”的音译——让工厂更聪明更智能。按照贾佳亚的定义,大模型时代会诞生相对应的工厂生产方式,当机械臂装上大模型或者拥有智能以后,它能灵活地自适应,像人一样思考,而不是如现在般由人工设置程序、设置参数。“人最后的结局是从复杂、危险、重复的工作中解脱,退出生产一线,并成为决策一线。”贾佳亚在近期接受《中国企业家》采访时说,这是一个极致的物的世界,人的角色最终会转向决策与管理者。
贾佳亚在2019年选择创业,委实不是一个好的时间窗口。那时候,AI四小龙(商汤科技、旷视科技、依图科技、云从科技)正在经历最后的余晖,此前,市场上大量资金都投向了它们,它们的视觉技术用在了安防、消费等领域,但都收不回成本,陷入巨额亏损之中。这让AI的故事在投资人面前难以为继。2019年,国内AI企业的融资金额比2018年下滑了34.8%。但一些人仍坚定支持贾佳亚的创业,他们认定,当姚明出现的时候,你不可能不注意到他,贾佳亚就是AI界的高个子“姚明”——他是一个顶级科学家。2000年,贾佳亚本科毕业于复旦大学计算机系,随后在香港科技大学获得计算机科学博士学位,成为香港中文大学终身教授。他在香港中文大学创建的DV Lab(深度视觉实验室)被认为是亚洲在CV和AI领域最领先的实验室。在这期间,贾佳亚还曾去微软研究院做访问学者,当时的院长是沈向洋。2017年,贾佳亚加盟腾讯优图实验室,并当选腾讯杰出科学家,这个实验室以视觉技术见长,它支持了腾讯高清以及无延迟的直播等多项业务。之所以离开腾讯选择进入制造业,是因为贾佳亚相信,人类发展最根本的主题是如何大规模地进行生产,技术和软件要靠硬件去承载,去驱动生产和生活,“就如同有个PC你可以玩游戏,有一个好的茶具你可以跟人家喝茶,有个摩托车你可以出去开”。2019年底,贾佳亚离开腾讯,创立思谋,这是一个为工厂提供工具的公司,比如用于质检的传感器,出货量达到10万台,为3C、芯片、汽车、新能源等国际大厂商供货,“这个和传统人工的肉眼检测相比,无论是效率还是准确率,都有百千倍的提高”。此外,在贾佳亚为各大制造厂商打造的智能工厂里,有各种奇思妙想的智能机械:比如自动挤奶油机械臂,帮助蛋糕工厂实现无菌生产;一个喷气式的机械臂,能吹起饼干实现自动翻面,帮助食品工厂节省人力……这些产品都以软硬一体的方式供给客户,这可能是贾佳亚在腾讯学习到的“产品”思维——交付给客户,开箱即用:“以前没有办法用机器替代,我们就找到痛点去做,痛点的解决方案是用AI,而不是纯粹的数字化。”这是贾佳亚结合了学术和产业界无数经验后的独特思考。思谋的投资人真格基金投资总监秦天一说:“市场变化很快,但这里面,最大的不变的点其实还是最优秀的那一批人。”科技投资的宿命永远是平衡技术的先进与当下的竞争。秦天一说:“当你的性能可以吊打别人的时候,其实就不存在竞争。”贾佳亚在18个月内完成了四轮融资,思谋成为当时最快晋级独角兽的初创公司,它最后一次宣布融资消息是在2021年6月,获得了由IDG资本、红杉中国、联想创投等联投的2亿美元。随后,这家独角兽在融资消息公布上选择了低调。2000年左右,机器学习被很多制造公司应用,但随着深度学习的出现,以样本学习为核心的机器学习已经过时了。以手机喇叭质检传感器为例,以往机器学习用的方法是,让机器首先看完100万张手机喇叭的图,或者学习100万次或者10万次的声音才能分辨出,什么样的是好喇叭,什么样的是有瑕疵的喇叭。“但它并不理解这是个什么东西,它只是理解你给我这个东西哪里好哪里坏,去做判别。”贾佳亚说。人工智能技术路径的发展是机器学习—深度学习—大模型。深度学习出现时,贾佳亚团队是最早一批研究团队之一。待他2019年离开腾讯并创办思谋时,所有业务的技术基础都是在深度学习之上开展,然而其时行业中依然不少公司和工厂沿用机器学习技术。再之后,大模型来了,机器理解有了突破性进展,它从“知其然”走到了“知其为所以然”的地步,智能工厂的爆发只差临门一脚。2022年,思谋科技开始研究大模型,2023年11月,发布了全球首个工业多模态大模型IndustryGPT,彻底打破工业领域大模型空白。贾佳亚的目标,是让它不断开发迭代并成为像人一样具备思考、学习能力的智能体。大模型技术提供了机器的思维以及学习能力,但人们在一件事情上争论不休——究竟机械臂和机器人,哪个是智能工厂的最优解?2017年至2018年,特斯拉的Model 3遇到产能陷阱,马斯克直接睡在内华达州超级工厂里,亲自查看流水线的每个环节,在某个地方,他发现机械臂拖延了速度,他直接上手,换掉了机械臂,结果效率高多了。马斯克做对了一半,它将人视为效率生产的阻碍因素,所以大规模推行自动化,但另一半却做错了,因为机械臂那时还做得不够好。自动化看起来是个美妙的词,但本质上,这是一个高度计划的程序,各个机械臂的活动范围被精准到几毫米,就算是机器人,它的路线运行与活动轨迹被严格规划。贾佳亚思考了好几年,他总结,智能制造重要的一个指标就是灵活性,机器能自适应工厂的各个流程,以机械臂抓取玻璃为例,编写出的程序永远不能预测抓取玻璃该用什么力道,可能千分之一的力道变化,玻璃就碎了。“人们总是高估硬件科技的发展,低估软件的发展速度,ChatGPT到4.0再到5.0都不稀奇,它都会呈现出一个很聪明的状态,但如果将其放置到机器人当中,那就太稀奇了。”贾佳亚表示。对于机械臂与人形机器人的选择,贾佳亚认为是机械臂,他认为,工厂生产最重要的考量是稳定,而不是工具的先进与否,“机器人投入没个5年不会看到结果,不可能家用也不可能量产,但机械臂已经大规模开发了三四十年”。来源:视觉中国更何况一个新事物进入工厂的生产体系,可能要经过10年之久,要经历机器融入、各个模块对接以及机器之间的通讯协议、工厂各类信息的保密。这样一个场景的幕布在徐徐展开:在一个没有光线,没有人类痕迹与氧气的厂房里,机器自主运转,设备自主生产,这是一个纯粹物的世界。各类应用以人或者非人的状态存在,它们自由穿梭在各个产线、流程之间。“只有实现了大规模、无干预性的自动化生产,人类才能够在社会的其他层次和领域,慢慢展现出自动化性,所以人类家庭里出现这种自动化没有那么快。”贾佳亚说。未来的工厂是适应机器生产,而不是适应人类生活的环境。
4月中旬,DV Lab发布了多模态模型Mini-Gemini,具有相当能力的推理和图片理解。Mini-Gemini提供了2B(20亿)到34B(340亿)参数的不同选择。在多个指标上,与Google Gemini Pro、GPT-4V毫不逊色。目前,Mini-Gemini从代码、模型到数据全部开源了。贾佳亚希望Mini-Gemini对未来开源大模型社区发展发挥积极推动作用。目前,贾佳亚还担任着香港中文大学的教职,每周还给学生讲课,他领导的DV Lab一半的人研究NLP,试图让大模型更聪明,另一半的人研究多模态,也就是视觉、听觉与大模型的结合体,大模型变得越来越像一个智能体。商汤CEO徐立是贾佳亚的学生,思谋CEO沈小勇也是贾佳亚的学生。读贾佳亚的博士,以能毕业为最高目标,原因在于他对学术的严苛。他告诉《中国企业家》,一个人写出的论文要以有用为核心,有用才能解决问题,用于实际,兴趣只是附着物。在微软研究院做学者以及香港中文大学任教时,贾佳亚结识了前旷视科技首席科学家孙剑、商汤创始人汤晓鸥,孙剑和汤晓鸥先后在2022年和2023年去世,他还专门发文悼念,他称汤晓鸥深刻影响了自己,“要做大的事情,要做顶尖团队的事情”。对于贾佳亚、稚晖君、杨植麟来说,在AI上的探索,注定了是一趟孤独之旅。杨植麟曾对媒体说,这是一种面对雪山徒步的感觉,技术未知,路径未知。人改造工厂,升级工厂的最终目标是实现工厂生产无人化。看起来,包括贾佳亚在内,世界上最聪明的一批人正在踏上制造“聪明与智慧工厂”的冒险,而在这条路上,谁可以成为“福特”或者“瓦特”也许并没那么重要。新闻热线&投稿邮箱:[email protected]
。END 。