暴走1万步,36氪带你看AI春晚|直击WAIC 2023
智慧篮球场、3D数字人直播厅、人形机器人、英语口语教练,关于AI,这里应有尽有。
文|杨逍 林炜鑫
编辑|苏建勋
来源|智能涌现(ID:AIEmergence)
封面制图|虞景霖
大模型的风吹了半年,2023年的世界人工智能大会(WAIC)成了不可缺席的盛典。
7月6日,WAIC在上海世博展馆正式开幕。本次WAIC参展企业超400家,首发产品达30余款,大会聚集了国内外领军学者、知名企业家、国际组织代表等1400余位嘉宾,国内外院士80余位。
可以说国际上有头有脸的人工智能专家、创业者都集齐了,特斯拉CEO埃隆·马斯克(Elon Musk),华为轮值董事长胡厚崑,微软全球资深副总裁、微软大中华区董事长兼CEO侯阳,地平线创始人、CEO余凯,图灵奖得主杨立昆(Yann LeCun),微软原执行副总裁、美国国家工程院外籍院士沈向洋与IEEE CEO拉曼......
和热闹的学术、产业盛典相比,展馆中的展品也并不逊色。大模型、机器人、自动驾驶等企业都争相大秀肌肉。这里大概是,离未来最近的地方。
从大模型火热以来,AI绘画、AI写文、AI作诗等早已不是新鲜事。
展会上,腾讯带来了AI游长城的体验,站在展厅中间,就如同真实地站在长城墙上,能一览城墙外的高树和墙上的一砖一瓦;
商汤则带来了针对篮球运动的智慧篮球场,不用摄影师,就可以记录下投中三分的精彩瞬间;
还有人体支架一般的康复机器人、做切割手术的微创机器人、能翻跟头的巡检机器人,都着实吸引眼球。
玩转AI应用
AI除了能写诗、画画,还可以成为你的球场专属拍摄员,24小时口语教练,让你云游长城,漫步中国。
商汤的智慧篮球场和秒画
实时记录投中三分球的高光时刻不再是梦想。
每一个打球的人或许都希望自己是聚光灯下的焦点。现在,商汤科技的SenseShot智慧篮球场能帮你实现心愿。
在AI能力的加持下,这块球场实现了无人化赛事直播。当你站上球场,直播摄像头自动跟踪篮球和球员进行运镜,实现“推/拉/摇/移”的直播效果。直播画面还能实时显示比赛得分。
打完球,你可以在商汤科技的SenseShot(智胜时刻)小程序看到自己和球队的精彩镜头视频集锦、AI运动分析等。
团队利用了2D关键点提取和3D视频动作捕捉技术等进行了球场3D建模,市民在录入人脸信息后,系统会自动捕捉人脸人体的29个关键点和篮球,进行单人/多人的逻辑计算和分析。有了每个人在空间中的三维坐标,就能够实现镜头的自动跟随、个人视频集锦以及分析人在不同运动状态下的动作特点。
商汤SenseShot~智慧篮球场
据商汤工作人员介绍,实现这样一种运动类型的数据训练和轨迹捕捉,大概只需要一周的时间。
除了智能篮球场,商汤也展现了其画面生成功能的SenseMirage秒画功能。
不懂代码没关系,只要输入简单的prompt(文字描述),商汤秒画平台就能生成你想要的图像,而且支持二次元、三次元等多种风格。这背后是基于商汤“日日新”大模型的支持。比如,把20张港风照片拖到秒画平台,大概只需要几分钟,就能获得一个能够生成港风照片的大模型。
腾讯AI游长城
在腾讯展台上,腾讯游戏将整座长城搬到了手机上,用户只需要踏上长城开启键,就可以通过裸眼3D全息投影展陈的方式,云游长城。
而这背后想展示的,是腾讯的云游长城。为了提升使用体验,开发团队运用自研AI技术,加强画质。我们不仅能看到长城上的砖块纹路,还能看到一只蝴蝶从长城石阶上的树枝飞过。
借助数据自动生成和植被模型处理等AI能力,它真实再现了长城的峡谷、山峰、悬崖、岸边等不同地形,有不同高低落差、不同种类的植被错落,实现了毫米级别的长城主体,以及清晨、中午、傍晚、深夜不同时间的光影交互,和动态的植被、鸟虫云雾等特效。
网易有道口语教练
找英语口语教练不再是难题。
虚拟人口语教练是网易有道首个教育领域自研大模型“子曰”的应用成果,希望成为普通人英语口语练习神器。
口语教练不仅有类真人形象,发音地道,还能进行开放式对话,适配不同英语水平的用户。
在对话过程中,口语教练像老师一样,有步骤地引导、启发式学习陪伴,同时还能进行实时反馈。在生成对话报告中,AI老师会从发音、语法等维度给予建议和润色,尽最大可能帮助英语口语学习者。
这款产品,目前仍处于测验阶段,即将上线,在网易有道等产品中就可以免费使用。
出门问问 奇妙元 3D数字人
短视频达人都在用的数字人创作平台,要属奇妙元了。
该平台由出门问问的创新团队打造,拥有数十位高逼真写实数字人和3D数字人,还有百余种精品发音人可供选择。平台提供一站式服务,仅需5分钟、简单4步,就能批量生成你想要的视频内容。
在展会上,身穿出门问问轨迹定位设备的小姐姐在前方舞蹈,后方视频正实时生成3D动漫人物。
会玩的朋友,也可以在奇妙元制作自己的数字分身,只需前期采集5分钟有效的人物视频,就能构建一个媲美真人的AI数字分身。
蜜度文稿通:一位诗人
蜜度展区站着一位“AI诗人”,只要把你想要的主题风格告诉它,比如“故乡”“青春”“塞外大漠”等提示词,它就能现场作诗,交给你一篇符合主题的现代诗。
机器人已来
机器人无疑是本场展会的亮点之一。
医疗机器人、巡检机器人等产品,在人工智能技术帮助下,已掌握了灵活的避障能力、行走能力、工作能力,可以作为生产力工具进入工业、医疗现场,帮助降低人的工作压力。
人形机器人,则由于其硬件难度高、软件智能程度、情绪感知能力要求高,被称作机器人界难以攀越的珠峰。很长一段时间,只有技术一流、商业化场景不明的波士顿动力在撑起这个赛道。在大模型技术爆发后,其流畅的对话能力,让学界和产业界又燃起了对人形机器人的期望。
特斯拉Optimus
本场的最大亮点,本应该是特斯拉的Optimus,就在开幕式上,马斯克还通过连麦的方式为其Optimus打广告,表示特斯拉希望通过Optimus来取代人类劳动中重复、无聊且危险的部分。未来,这款产品会将先应用于工厂。
然而,在展台上,特斯拉没有带来真“人”Optimus,只展示了其模型。
据特斯拉展台工作人员介绍:“Optimus搭载了D1芯片,能实现的只有动作交互,对话和情感交互还在研发,未来还会想开拓C端的场景,比如陪护,遛狗。目前的价格和model Y差不多,暂时不量产。”
特斯拉Optimus
傅利叶人形机器人和外骨骼机器人
傅利叶在开幕式上推出了他们的人形机器人GR-1。有1.65米高,体重110斤,标准健康体重。
为了实现这样的能力,GR-1全身自由度有40个关节,最大关节模组峰值扭矩可达300NM,步行速度可达到5KM/h,能负重50公斤。
傅利叶人形机器人
它有着不错的运动能力,整个身体高度仿生,运动控制也呈现拟人化姿态,可以进行快速行走、敏捷避障、稳健上下坡、抗冲击干扰等动作。未来,GR-1可以用在抢险救灾、养老陪护、家政服务等应用场景。
傅利叶也带了外骨骼机器人出场,主打康复功效。
傅利叶外骨骼机器人
这款产品主要用来帮助病人复健,在身体行动不便时,身体肌肉不会出现萎缩等情况,帮助肢体障碍的人士重新恢复运动功能。
达闼人形机器人
让机器人跳舞有多难?达闼推出的服务机器人Cloud Ginger 1.0(小姜)表示,so easy。当你告诉小姜,“跳个舞吧”,小姜就会跟随音乐开始起舞。你还别说,小姜的身板毫不僵硬,手臂灵活,卡点精准,最关键的是,小姜给人舒展、松弛之感,打破了我们对机器人的刻板印象。
工作人员介绍,小姜身高158cm,搭载34个智能柔性关节SCA,还内置多个2D/3D摄像头、激光雷达、超声传感器等。小姜的大脑搭载了自研的HARIX OS操作系统,赋予小姜AI能力。
达闼机器人
实际上,小姜不仅会跳舞,还能冲咖啡。得益于高精度的传感器和控制系统,小姜制作的咖啡能精确到每一滴。
不过,目前,达闼推出的机器人足部仍然是单柱形态,非双足的人形姿态。它的使用场景,主要应用于商场、银行、展会、养老院等迎宾场景。
优艾智合高原科考机器人ARIS-8848
机器人ARIS-8848很酷,它曾攀登珠峰。
去年五月,为了保障气象科考队在珠峰的气象考察工作,优艾智合基于巡检机器人的技术框架和商用案例积累,花费一年进行产品设计与打磨,推出了高原科考机器人ARIS-8848。
优艾智合-攀登珠峰
针对青藏高原的高海拔、超低温和复杂地形,ARIS-8848拥有履带式的移动底盘,可以在沙石、冰川等复杂路面运行,同时机身集成包括3D摄像头、激光雷达、红外摄像仪在内的多种传感器,能够识别复杂地形和障碍物。
除了攀登珠峰,ARIS-8848更强的是能在低温环境下运行,信号传输稳定,辅助科考工作顺利进行。
睿尔曼双臂复合升降机器人
睿尔曼其实是一家机械臂公司。
睿尔曼的双臂复合升降机器人,则被定位为家庭服务管家,当你需要一杯水,机器人会帮你从厨房取出来端给你,当你需要整理杂物,机器人可以按你的指示,自动收纳物品。甚至,晚上你躺在床上,懒得起床去关灯,喊一声机器人就行了。
为了让机械臂更贴近普通用户的家庭场景,睿尔曼对核心零部件采用了全链路、强耦合的设计方式,达到了本体自重6Kg(含控制器7.2Kg),额定负载5Kg,负载自重比达到1:1.2,最大负载9Kg的极致性能。
同时,睿尔曼把大模型产品接入机器人操作系统,提升了语音交互体验。
睿尔曼双臂复合升降机器人
云深处科技绝影Lite3和X20
巡检,是机器狗的常用场景。
展厅上,云深处带来了绝影 Lite3和绝影X20两款产品。
绝影 Lite3主要用于教育科研场景,可帮助呈现编程效果。绝影X20则是一款电力巡检和特种应用机器人。Lite3展现了翻跟头的绝技,绝影X20也展现了上楼梯的效果。
绝影X20最快速度4.95m/s,能负重20 公斤,可以上 20 公分的楼梯,跳过宽 1 米的沟壑,且在废墟里也能行走。
云深处科技~绝影四足机器人
绝影 X20 拥有IP66的防护等级,工作台可以搭载双光云台、机械臂、调试架、4G/5G 模块、北斗/GPS/RTK模块等,环境感知方面可实现自动的目标检测与识别,搭配深度相机、激光雷达和智能算法,可实现精准导航、动态避障和人机交互等功能。
当下,绝影X20与电力巡检和特种应用这两大场景结合紧密。绝影X20能完成从自主规划路径,到采集巡检数据、生成巡检报告,再到自主充电、循环作业的全流程巡检。在消防侦查场景,绝影X20能灵活开展无人侦查和搜救工作。
微创机器人
机器人也可以做手术了,还能远程操作。
“图迈”胸腔手术机器人,是外科医生的好帮手。这款机器人由上海微创医疗机器人公司自主研发,是目前唯一一款由中国企业研发并获批上市的四臂腔镜手术机器人。
“图迈”已经在全国 20多个省份的40多家医院,完成了超过 1000 多例的临床验证,手术全面覆盖了胸腔、腹腔、盆腔的一系列高难度微创伤。在手术过程中,“图迈”可以帮助医生做到精准识别、精准切除、精准解剖。
微创机器人
“图迈”在5G超远程手术方面也得到临床研证。据介绍,2022年6月11日,“图迈”连接横跨近5000公里的新疆克州和江苏南京,顺利完成两例泌尿外科超远程手术,实现迄今为止世界最远距离的5G远程机器人手术。
这些硬件可能改变未来
科技总是先成为创新产品,再逐步迈入生活。
大会上也展出了一些好玩的,能改变大家日常生活的新科技产品。送外卖的无人机,还有新的掌中付款码,还有自动控制的轿车充电器。
随着商业化的进展和推广,他们可能会从科技展厅飞入大家的生活。
美团第四代无人机
为了送外卖,美团把无人机都用上了,将自动驾驶用到了极致。
美团展出了最新的第四代无人机,采用六轴飞行器,最大载重2.5公斤,满载最大配送距离10公里,3公里半径内的外卖配送时间一般不超过15分钟。
美团第四代无人机
和上一代相比,新机型除了性能更佳,对环境的适应性也更强,即便在“零下20度至50度”的雨雪大风天气,也能安全运行。
目前,美团无人机仅在深圳、上海等城市落地15条航线,更多还是配合外卖员完成日常配送。
微信刷掌支付
在机器视觉能力的加持下,付款方式正一步步被改变。从最早的相机扫描二维码,再到人脸识别。如今,微信又推出了刷掌支付功能,识别更为细致的手掌纹路。
微信刷掌支付
有了微信刷掌支付,只需要录入手掌纹样,在消费时,伸手就可以完成支付。相比刷脸支付,刷掌支付无论在安全,还是精准度上,都要更高一些。
据报道,北京的部分地铁线已经上线刷掌乘车服务,乘客伸手即可进出站。
36氪旗下AI公众号
来个“分享、点赞、在看”👇
微信扫码关注该文公众号作者