智能周报|腾讯连投3家大模型公司;苹果发布首款头显,押注下一代硬件平台;富国银行等撤回在微软生成式AI中的广告预算…
智能领域本周来了搅局者。
当地时间6月5日下午(北京时间6月6日凌晨),苹果在硅谷总部发布了其首款头显设备——Vision Pro,原本在科幻电影中出现的人机交互方式在这款产品上都出现了:它没有手柄,只需要把设备戴在头上,通过眼神注视和手指捏合,或者直接呼叫siri用语言操控,就能控制这台架在鼻梁上的电脑。而那些原本在手机或电脑屏幕上呈现的网页、设计图纸、电话聊天对象,都以立体的方式浮现在了「眼镜」前的无限物理空间中——屏幕开始变得无限大。
Vision Pro的出现让外界开始思考「最适合AIGC的硬件到底是什么」这个问题,答案显然不是现有的桌面电脑,也不是智能手机。
智能领域即将开始AIGC的软硬协同新时代。有关大模型的竞逐仍然热烈,本周,国内外该领域都有重大融资事件发生。周初,生成式AI初创公司「光年之外」又曝出融资事件,腾讯参投。虽然尚未推出自研的大模型和相关产品,腾讯在本周内已密集投出3家大模型公司(MiniMax、光年之外和深言科技)。下半周,AI芯片开发者英伟达也坐不住了,它入股了加拿大的生成式AI公司Cohere。
不过,生成式AI的商业模式仍然是个挑战,包括富国银行在内的多个广告主撤回了在微软、Google等生成式AI中的广告预算。
以下是过去一周最值得关注的智能新闻,内容由《第一财经》YiMagzine的最新IP「新皮层NewNewThing」团队制作。
Key Points
大模型篇
光年之外再融资,但不是传闻的2.3亿美元;;
腾讯连投3家大模型公司;
英伟达入股生成式AI公司Cohere;
富国银行等撤回在微软生成式AI中的广告预算。
硬件篇
苹果发布首款头显,押注下一代硬件平台;
苹果收购AR初创公司Mira;
苹果Vision Pro被曝使用了「脑机接口」技术。
大模型篇
光年之外再融资,但不是传闻的2.3亿美元
6月5日,据量子位消息,王慧文(美团前联合创始人)的AI创业公司光年之外,已在近期完成新一轮2.3亿美元融资,投前估值10亿美元。
具体融资情况
光年之外发展历程
腾讯连投3家大模型公司
一周内,腾讯接连下注了国内3家大模型初创公司,显示出内部研发和对外投资两条腿走路的大模型策略。
这些AI初创公司获得腾讯投资
腾讯在大模型领域的主要动向
英伟达入股生成式AI公司Cohere
据路透社6月8日报道,Cohere完成2.7亿美元C轮融资,投资方包括英伟达、甲骨文、Salesforce等。Cohere公司没有披露估值,但路透社援引消息称,Cohere公司这轮估值为22亿美元。
Cohere是谁?
Cohere是一家加拿大初创公司,创立于2019年。创始人包括Aidan Gomez,Ivan Zhang和Nick Frosst。其中,Gomez是知名论文「Attention is all you need」作者之一。在当时的Google Brain团队(现在是Google Research团队的一部分)时期,Gomez曾在Google实习,并与Geoffrey Hinton、Łukasz Kaiser一起工作。
目前,Cohere开发的自然语言处理软件主要用于改善用户与聊天机器人的对话,主要服务包括流媒体、服装公司、聊天机器人软件公司等企业客户。
Cohere现有投资者有哪些?
在Cohere公司的A轮融资中,多位知名AI技术人才也参与其中,包括Geoffrey Hinton、李飞飞、Pieter Abbeel和Raquel Urtasun。
Google也是Cohere的主要投资者之一。据《华尔街日报》10月22日报道,Google当时计划投资至少2亿美元,Google的云部门也将为Cohere提供训练软件模型所需算力。
云计算服务商在这轮AI创业潮的资本活动中行动积极。微软、Google、甲骨文都在投资相应的初创公司,例如OpenAI与微软绑定,Cohere之外,Google还投资了OpenAI高管创立的Anthropic。不过,Cohere公司总裁Martin Kon表示,该公司持中立态度,不会谋求单一公司的投资。
Google、微软在AI搜索产品中塞广告,广告主急了
在微软、Google先后尝试在AI搜索产品中增加广告后,路透社6月9日援引一位广告采买方消息称,多家大型广告主暂时从微软撤回了他们的广告预算,包括富国银行。原因是广告主无法选择退出这类广告的投放,同时对于投放效果有担忧。
广告主在担忧什么?
品牌安全:广告主不能选择退出Google测试的AI广告投放。
广告曝光:部分广告主表示,他们担心营销预算花在仅有有限规模的用户功能上,同时还担忧无法掌控广告的展示区域。
虚假信息:两名主流广告公司的媒介采购方称,他们担心广告出现在带有虚假信息或者错误信息的AI回复中。
效果分析:3名广告买家表示,他们无法确定AI广告与传统搜索广告的效果差异,也无法确定哪些搜索词触发了广告。
对用户有什么影响?
今年2月,微软Bing搜索推出聊天机器人产品Bing Chat,当时已经开始测试新的广告形式。次月,微软正式宣布,Bing Chat将塞进更多广告——通过重定向部分传统搜索广告,在Bing Chat的回答中塞进部分广告。
Google、微软都宣称,生成式AI聊天服务中的广告能提供更好的用户体验。但实际并非如此。科技博客Gizmodo测试中发现,微软Bing Chat实际可能有两种主要的广告形式,标注“广告”的回复内容,以及部分商品可能也是广告投放,但没有标注“广告”。与此同时,聊天服务中插入的广告无法屏蔽,因为屏蔽机制可能直接影响聊天机器人的回复。
总之,生成式广告无论对用户还是广告主,体验都没那么好。
硬件篇
苹果发布首款头显,押注下一代硬件平台
所有科技公司开发者大会的关键词都是「AI」的时候,苹果回归了「硬件」。
北京时间6月6日凌晨的苹果开发者大会(WWDC)上,在新款MacBook Air、新款芯片M2 Ultra和一系列操作系统更新后,苹果CEO库克(Tim Cook)用40分钟——近乎一半的时间,发布了号称具有革命性意义的新硬件——Apple Vision Pro。
「就像Mac将我们带入了个人计算时代、iPhone引领我们进入移动计算时代一样,Apple Vision Pro将引导我们来到空间计算时代。」库克站在Apple Park的乔布斯剧院舞台上宣布。
这座剧院为纪念苹果的创始人乔布斯(Steve Jobs)而设计,纪念这位以创新著称的创始人。库克被乔布斯亲自挑选为接班人,留给外界的印象只有「供应链和成本控制」。只要消费者接受了Apple Vision Pro,库克似乎就能有力反击那些称他「缺乏创新」的声音,以及那些在ChatGPT发布之后对苹果在AI新时代的「毫无作为」感到失望的人。
包含VR(Virtual Reality,虚拟现实)、AR(Augmented Reality,增强现实)、甚至元宇宙等概念在内的一系列公司,也都在等待苹果拯救。2021年,Facebook出于对虚拟现实的期待更名Meta,但自那以后,头盔市场的销售并不大,里面的应用程序更少,预期的VR大爆炸并没有发生。微软通过昂贵的透明镜头显示电脑图片的Hololens,也失败了——希望被寄托在产品定义能力和市场投入能力最强的苹果身上。
(注:此新闻为节选,阅读这场发布会的完整报道,请点击:大公司|苹果发布首款头显,押注下一代硬件平台)
苹果收购AR初创公司Mira
Mira是一家什么公司?
Mira创立于2016年,是一家总部位于洛杉矶的AR初创公司,主要为客户制造AR头显。Mira最初的产品定位是“AR世界的轻量级体验”,主要在消费者应用方面发力,后来转向了利润更可观的工业硬件。
苹果这笔收购的价格未公开。此前,Mira已融资约1700万美元,投资方包括Blue Bear Capital、Happiness Ventures和红杉资本等。
Mira公司的CEO Ben Taft称,作为收购的一部分,苹果已聘用了至少11名来自Mira的员工。
Mira的主要客户:
军方:Mira与美国海军签订了一项超70万美元的协议,也与空军签订了小规模的合作协议。在与空军的合作中,Mira为军事飞行员提供Prism Pro头戴显示器,用于显示设备操作等指令信息。
企业:Mira还与任天堂合作,为主题公园中的马里奥赛车项目提供头戴显示器,向游客展示游戏中的虚拟角色和物品,增强玩家感官体验。
苹果的AR、VR收购历程
苹果Vision Pro被曝使用了「脑机接口」技术
6月6日,在苹果发布Vision Pro头显之后,一位自称曾负责开发该设备的苹果前员工Sterling Crispin在Twitter上发文,透露了这款硬件的部分技术细节,其中使用到了初级的脑机接口技术。
Crispin 在苹果做过什么?
Crispin已在AR和VR领域工作了10年,在苹果的3年多时间里,他担任神经技术原型研究员。他在苹果所做的工作包括 Vision Pro的基础开发、正念体验及与神经技术相关的前沿研究。
Crispin称Vision Pro为“整个行业发展的集大成者”,但要完全实现这项技术的宏伟愿景,可能得到2023年。
Crispin介绍了哪些专利内容?
Crispin在苹果的大部分工作都受到保密协议的约束,但部分工作已通过专利公开,以下是他介绍的专利内容:
· 通过身体和大脑数据来检测其精神状态。当用户处于VR或AR体验中时,AI模型会尝试预测其是否处于好奇、注意力分散、害怕、专注、回忆过去等认知状态。这些状态可以通过眼球跟踪、大脑的电活动、心跳、肌肉活动、大脑的血密度、血压、皮肤电导等测量数据来推断。
· 在用户实际点击之前预测到其将要点击的内容。这项工作的原理是,人的瞳孔在点击之前会有反应,因为人已经在期望点击后会发生的事情。因此,设备通过监测用户的眼动行为,接收大脑的生物反馈,实时重新设计用户界面,这是通过眼睛实现的一种简单的「脑机接口」。
· 以用户察觉不到的方式快速闪烁视觉或声音,并测量他们对此的反应。
· 利用机器学习和来自身体和大脑的信号,来预测用户的注意力集中程度、放松程度或学习效果,更新虚拟环境以增强这些状态。
新皮层New New Thing
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
识别下图二维码,
即可购买《第一财经》杂志2023年6月新一线特刊
苹果收购AR初创公司Mira;
微信扫码关注该文公众号作者