文/VR陀螺
当地时间 2 月 2 日,售价 3499 美元的 Apple Vision Pro 正式发售。
北半球的寒冬压不住大家想要一尝跨时代新品的冲动,发售当天一大早美国各大 Apple Store 便排起了小长队,吸引了来自全球各地的果粉、发烧友、网红博主与行业人士。作为苹果开启空间计算时代新篇章的第一款硬件,Vision Pro 被苹果寄予厚望,近乎顶配的硬件配置、革命式的概念让其一次次刷屏各大社交媒体平台。与此同时,大洋彼岸的国内 XR 厂商们也不甘寂寞。从去年 6 月 Apple Vision Pro 发布以来,VST 类头显代表包括玩出梦想、小派、创维和亿境等厂商纷纷跟随空间计算的脚步,提出自己的主张与业务布局;得益于产业轻薄型 AR 技术多年沉淀,OST 类眼镜代表 Rokid AR Studio 空间计算套装也在去年8月发布,以新品拥抱空间计算革命。2024 年,是 XR 空间计算时代的落地之年,亦是 VST 与 OST 技术路径第一次以相同革命目标,走向更大共存市场的一年。两者没有拔刀相向的市场冲突,但却有着差异化的用户体验。借 Apple Vision Pro 上市,一场场关于 VST 与 OST 的未来议题也被带上舞台中央。Apple Vision Pro 是库克时代首款真正意义上的“代表作”,苹果在 XR 上探索长达 7 年之久的技术集合。Vision Pro 的产品配置以及参数,相信大家已经耳熟能详。而在近日海外一众媒体的评测中,我们才真正看到了参数背后带来的强大体验。 《The Verge》认为这是有史以来最好的 VST 头显,这可能意味着基于摄像头的混合现实透视可能是一条可行的路。并且其手眼追踪技术感觉就像魔法一样(当它起作用时);《华尔街日报》的记者评价这是其尝试过的最好的混合现实头显,并且比 Meta Quest Pro 和 Quest 3 先进得多。当然,并非所有的体验皆完美。海外媒体不经官方审核、独立发表真实使用体验,在前几天也是刷屏网络。几大媒体评测共同使用 FaceTime 通话这一幕不禁令人捧腹大笑,感觉大家都在使用“90 年代的座机”进行视频通话一般。 貌似苹果的 AI 图像技术需要进一步提升,不求做到美图秀秀那样的个性化美颜效果,只求还原“iPhone原相机”,毛玻璃滤镜求求你不要太离谱。Vision Pro 虽然电池采用了外接形式,但是头显内置了诸多核心元器件,如 M2+R1 的芯片平台、RAM+ROM、2×1.42 英寸Micro-OLED(网传尺寸)、多片式光学透镜、以及红外、RGB 相机等系列传感器,这使得产品重量达到了 600-650g(具体取决于 Light Seal 和头带的使用)。基于 Vision Pro 的重量,于是乎网上出现了这样的“头部健身图”——旨在锻炼头部的承重力,趣味性十足。这是目前“VST 头显”类产品较难避免的负重问题,特别是一体式集成的产品,只能通过额外的头带增强人体工学设计,分散压力。Vision Pro 除重量外,价格也是大家的经常用来调侃的点。苹果的高端市场战略,在 Vision Pro 上再次得到了展现,3499 美元的价格一跃成为苹果消费产品史上最贵的产品之一。 并且,如果用户想要真正体验到 Vision Pro 带来的空间计算,用于办公等场景,也许还需要额外购买妙控键盘、鼠标、Macbook,构建一个更强大的空间计算套装。是的,“只需支付‘非常低’的价格,你也可以拥有这一切。”苹果的全球影响力是巨大的,在此也感谢苹果,Vision Pro 的 “评测”给大家带来了如此多的欢笑与“对产品新奇的思考”。
VST&OST,空间计算的两条技术路径
事实上,苹果力推的“空间计算”是一种将计算机以自然的方式融入物理世界的技术。具体是指通过 VR/AR 等设备利用计算机视觉处理摄像头和其他传感器获取的数据,从而获得关于环境的视觉信息,包括物体的位置、方向、运动甚至材质属性。并基于多个传感器的数据融合,创建准确且全面的环境视图。
基于环境视图,VR/AR 设备可以利用空间映射技术创建环境的三维模型,以更精确地放置和操作数字内容。空间计算的主要优势之一是它能够理解环境的深度,使用户能够以真实且自然的方式与虚拟对象进行交互,按照与物理世界相对应的方式进行放置和操作。简而言之,空间计算大致可以理解为 SLAM 技术、AI 算法与 MR 等传感技术的结合。在实现这一愿景的路上,目前,苹果的选择是 VST 头显路线。VST 即“视频透视(Video See-Through)”,是基于头显外部摄像头,采集环境数据,以视频形式在镜头前为用户提供环境视频的透视技术。代表产品还包括 Quest 3、PICO 4 等。 与 VST 并行的另一条技术路径为 OST,OST 即“光学透视(Optical See-Through)”,这是一种基于透明的光学镜片提供的环境透视技术。代表产品包括 Rokid AR Studio 空间计算套装、Magic Leap2、Nimo Glass 套装等眼镜类型产品。 不同的技术路径,产品也存在较大差距。基于 VST 技术路径的头显类产品通常为一体式设计(AVP是个例外),头显端集成了核心处理器、近眼显示光学系统(屏幕+光学透镜)、RGB 相机、灰度相机(多个)、音频系统、电池等一系列组件,产品通常为 500g 起。致力于追求更高的性能运算、更大的 FOV、更精准的算法,以及更多元的交互。 而 OST 技术路径的产品,通常在原有的眼镜形态下做扩展,仅增加光学显示系统、音频系统、以及单个摄像头等轻量零部件。大部分 OST 产品设计一定程度上会减弱算法精度和 FOV 大小,但可以得到时尚的眼镜形态设计,以及轻量级佩戴体验,一般可以将重量控制在 100g 以内。性能方面,不少 BirdBath 方案的眼镜,如 Rokid Studio 空间计算套装将主机与电池外置,保持头部舒适佩戴体验的同时,提供性能运算。VST 与 OST 两种技术路径各有优势,基于目前的产业阶段和市面上的产品来看,VST 的头显类产品重“综合性能”,包含但不限于光学、算法、运算等,而 OST 眼镜类产品重“外观佩戴”,侧重于探索未来产品形态,以及轻量级舒适穿戴体验。
OST国内代表Rokid,用76g做空间计算
硬件配置方面,Rokid Max Pro 采用 0.68'' Micro-OLED+BirdBath 的轻量级光学方案,可提供 50 度的 FOV,相当于 6 米外 215 寸虚拟大屏,分辨率为 1080P。FOV 不大,介于信息提示与普通 VR 头显之间,但足够去观影、游戏,带来相对沉浸体验,同时提供真实世界视野。升级版的 Rokid Station Pro 带来了媲美传统 VR 头显的性能,其搭载高通骁龙XR+ Gen2 移动平台。相对于上一代,该平台续航提升了 50%,同时散热提升了30%,并提供 7620 毫安的电池。光学系统与核心主板是支撑 AR 显示与使用的基础层面。不过,在 Rokid 看来,其更注重系统软件能力,而非纯粹的硬件堆叠。Rokid 创始人&CEO Misa 在接受采访时说,Rokid AR Studio 是团队耗时 4 年才实现的产品,为了使眼镜尽量轻,其空间计算能力主要通过系统软件实现。
Rokid 为此专门开发了 AR 底层系统 YodoOS-Master 。“或是目前最为完整的一套面向空间计算时代的 AR 空间操作系统。”Rokid 副总裁&XR 中心负责人王俊杰在去年的发布会这样说道。 目前,YodoOS-Master 2.0 已支持空间模式、手势、语音等多种交互方式,也同样支持 0DoF、3DoF 和 6DoF 三种交互方式。还支持多种开发工具协同、多生态的应用,形成了一个相对友好且开放的内容生态体系。 空间计算的一大前提是“环境信息感知”。为此,Rokid AR Studio 采用了单目 SLAM 方案,通过一个普通的 RGB 摄像头,实现空间信息的定位和捕捉。按照 Misa 所说,这是 Rokid 的 AI 实力,正因为希望减轻眼镜的重量,所以采用了一颗摄像头的方案。而如何用一颗摄像头实现两颗摄像头的空间计算效果,厘米级的虚实贴合精度,背后是 Rokid 系统软件算法、AI 与硬件的深度融合计算。事实上,Rokid 的战略打法并不罕见。通过软件创新带动硬件市场,也是大多数消费电子厂商的主要战略,这一点在不少大型手机厂商上也能看见非常明显的身影,OS 也是最能做出用户差异化体验的板块。 基础硬件与自研 AR 系统 YodoOS-Maste 的结合下,造就了 Rokid AR Studio 空间计算套装。应用场景方面,Rokid AR Studio 空间计算套装可支持与 Vision Pro 同样的 3D 空间视频、3D 照片的观看。拓展键鼠外设下,Rokid AR Studio 空间计算套装也支持多屏办公。不仅如此,在 200 余款应用的加持下,AR 游戏娱乐、影视剧观看等基本功能也囊括其中。 这样一款支持空间计算的 OST AR 眼镜,将产品重量做到了 76 g,形成更轻薄眼镜形态。对比 Apple Vision Pro 至少 600g 的重量,Rokid Max Pro 削减了差不多 85% 以上,这是基于 OST 技术路径做分体式 AR 眼镜目前的一个较大优势。 另外一个相对优势则是成本。对于普通消费者而言,在购买第三块“大屏”电子产品时,价格将是影响消费决策的重要因素。苹果的高端产品战略,显然并不亲民,Vision Pro 合计 2.5 万元的价格,让人望尘莫及。而国内的 AR 眼镜当然更亲民一些,成熟普通的 BB 方案眼镜价格普遍在 2000-3000 元区间,而在增加相关移动主机,以及摄像头算法后,价格也能控制在万元以内,具备更好的市场普及潜力。 Rokid上半年空间计算消费级新品能否“接住”?
尽管 Vision Pro 价格颇高,产品体验也存在诸多尚待改善的方面,但苹果的入局,对于整个 XR 产业而言,却能带来诸多正向的推动作用。Misa 在近日做客某科技论坛上,评价 Vision Pro 时表示:“苹果这次把很多可能性、想象力、生态的前景都展示了出来,但是对产品大家其实总觉得还是欠点火候。”“我能讲的就是第一它真的太重。我大概戴了 20 分钟,我是有明显的酸痛感,酸痛到我后来活动了大概半小时。这是他最大的问题,现在海外的博主也反映了这个问题。” “第二就是在有的交互场景里面,它还是相对比较粗糙一点,那个是我们比较早的体验版本,我不知道现在有没有改进,但我最近看的 review 里面这个部分也有问题,比如说他的那个人脸扫描成像,最后出来的效果不他好。还有人发了张照片跟扎克伯格当时的照片对比,我在朋友圈发了这张照片。当时就是这个效果,我以为他会改进,但实际上后面没改进。”当然, Vision Pro 的发售对于Rokid 这样的 XR 公司来说,在供应链、用户教育、生态建设、技术启发将有很大帮助。比如生态,为 Vision Pro 开发应用的开发者,也可以很容易在 Rokid 的平台上开发类似的应用,Misa 透露目前 80% 在 Rokid 的开发者都是如此,代码迁移成本很低。他还说道:“我们一年大概花 1, 000 万人民币左右去支持开发者和生态伙伴,听起来 1, 000 万好像对创业公司是个不错的价钱,但是苹果就完全不是这个数量级,整个行业会热闹起来。”用户认知层面更是不言而喻,各大社交平台的热榜已经说明了答案,苹果强大品牌告诉了大家空间计算是什么,有什么用。而在苹果科普认知的同时,也给了更多 XR 厂商空间计算的消费市场缺口。特别是在Vision Pro 不光高价,还未在国内发售的这一时期。 而在国内诸多做 XR 的厂商中,OST 技术路径的Rokid 无疑是不可忽视的佼佼者。据亿欧网近日发布的《2024年中国AR产业发展洞察研究》报告,Rokid、雷鸟创新、XREAL 和影目科技占据了国内 AR 市场 85% 以上份额。 其中,Rokid 在中国消费级 AR 眼镜产品出货量占比中,以 27.9% 的占比排名第一,据称,企业用户和消费用户服务用户数已突破 100 万。Rokid 的这份成绩单实际上是研发技术布局、内容生态建设、产品战略选择和市场营销推广的共同结果。报告显示,Rokid 目前共有 314 项有效专利,主要涉及 AR 眼镜相关的产品工学设计、光学结构设计、感知交互技术等核心板块。创新技术专利的积累,为 Rokid 打造一条无形的品牌护城河,有利于企业打造更具差异化的产品,以及更长期的良性发展。AR 内容生态一直是产业的痛点,缺乏优质原生 AR 内容将在很大程度上将限制用户体量。作为国内 AR 独角兽企业,Rokid 在内容生态的上,扛起了建设的大旗,基于自研 AR 空间操作系统 YodaOS-Master,Rokid 先后共举办了两场 AR 开发者大赛,最高开发者单笔奖金达到了 10W。与此同时,Rokid 还深入产学研结合,与多所高校合作,推出 AR 高校系列培训课程,年均投入千万预算的“若琪空间站”开发者助力计划等。 不光要将内容“加进来”,同时还要将产品“走出去”。在市场战略方面,2023 年 Rokid 还携手 Google 打造了全球首款 AR 版 Android TV 设备,通过 Rokid Station(全球版),用户可以在 Google Play 上下载 YouTube、Hulu、Disney+、TVer、AbemaTV 等海量应用。强大的谷歌内容生态,为 Rokid 出海打下了生态基础,让其可以驰骋亚马逊等海外渠道。当然,Rokid 的 27.9% 的市场份额,除了其在 C 端的市场发力到位外,还离不开其 B 端业绩的支撑。结合 AI+AR,Rokid 的 AR 眼镜产品已应用在工业电网、油气化工、智能制造医疗和文旅等领域,产品销往 80 多个国家和地区。 此前 VR陀螺进行过实地走访,看到 AI+AR+工业数字化的转型案例。基于头戴式 AR 眼镜,其在工业应用中,可提供远程协助,员工培训等解决方案,进一步提供工作效率,保证工业安全。 Misa 多次在采访时表示,B 端是 Rokid 技术的试验田,正是因为 B 端有数量庞大、场景丰富的客户,Rokid 才能在技术上不断尝试和迭代。在 OST 空间计算这条技术路径下,Rokid 从软硬件专利技术、自研AR 操作系统、内容生态策略、B+C 双业务打法展示着它的独特一面与深厚积累。空间计算新时代下,有望在苹果 Vision Pro 的市场刺激下,迎来新一波业务增长 。
据 VR陀螺获悉,Rokid 还将在 2024 年 上半年将举办 OpenDay,带来消费级全新空间计算新品。基于 Rokid 过往产品路线,以及相关技术布局,新品仍可能是基于 BirdBath 方案的 AR 眼镜,以及移动主机盒子的改进款。全彩 Micro-LED+衍射光波导的方案可以将 AR 眼镜做到更接近眼镜的形态,进一步提高透光率,作为产品迭代方向毋庸置疑。但 Micro-OLED+BirdBath 的眼镜可以带来高清晰度,视觉体验更佳,成本更易控制,并且基于移动主机还能带来性能与算法融入,拥有更好的扩展性,似乎更符合当下做消费级空间计算 OST 产品的策略。Rokid 下一代空间计算产品落子何方,原有的产品布局是否会被打破,空间计算时代该怎么把握市场机会,且让子弹再飞一会儿。
活动详情请点击:
Vision Pro 来袭,应用生态开发者城市系列闭门活动开启报名!