Redian新闻
>
OpenAI 与 Google,暂时没有赢家

OpenAI 与 Google,暂时没有赢家

公众号新闻

两位劲敌在 AI 赛场上正面交锋的场景再次出现。


5 月 14 日,OpenAI 在产品发布会上发布了最新的 GPT-4o 多模态大模型,具有实时的语音、视频和文本交互能力。而就在这场发布会结束后的第二天,Google 也举办了 2024 年 I/O 开发者大会,一口气发布了好几款 AI 产品,其中最引发关注的是与 GTP-4o 对标的 Project Astra。


谁会胜出?


两位 AI 领域的创业者——出门问问创始人兼 CEO 李志飞与受邀参加 OpenAI 发布会的 jobright.ai 联合创始人郑玉典,对于这个话题给出了一个有趣的观点,那就是留给 Google 和 OpenAI 两大巨头的时间都不多了。为什么会得出这样的结论?以下是与他们的对话。


文末还有完整对话音频,也可在各大音频、播客平台搜索「科技早知道」收听,不要错过。






声动活泼

玉典受邀参加了此次 OpenAI 发布会,能否分享一下你在现场的感受?



郑玉典

Open AI 这次发布会规模并不大,只有 40 多人参加,CEO 山姆·阿尔特曼(Sam Altman)没有上台发言,并且在发布会结束后很快离开了。



▲ OpenAI CEO 山姆·阿尔特曼在发布会现场。| 郑玉典 摄


发布会 95% 的时间都在介绍 GPT-4o 模型。GPT-4o 的 o 代表 omni(意为全能),用 OpenAI 官方的话说,这是它们目前最先进的旗舰版多模态模型。


OpenAI 此前的模型主要是以文字、图片和音频为主,GPT-4o 新增了一个视频维度,也就是说它的输入可以是文字、图片、音频和视频,输出可以支持文字、图片和音频。


此外最关键的一点,是该模型是面向开发者的,可以供开发者使用。


▲ OpenAI 发布会直接在公司办公室举行。| 图源:OpenAI



声动活泼

就在 Open AI 发布会的后一天,谷歌举办了 Google I/O 大会,发布了 Project Astra。志飞在 NLP 人机交互,以及虚拟个人助理(VPA)等领域深耕了数十年。你如何看待这两家公司的产品?



李志飞

这两家科技巨头此次发布会聚焦人机交互,在发布的大模型中,重要的关键词就是多模态和实时。这也是人机交互里非常重要的两个维度。


在此之前的 Siri、Google Assistant,包括国内的各种语音助手,基本上只是语音交互系统,无法集成图片、视频,更不可能集成在一个模型里。但人的交互方式就是多模态的,我们在聊天的过程中,我不仅可以看着你说话,也能注意到周边的环境,这就是一个典型的多模态交互过程。过去并没有这种真正的多模态交互助理,因此看完这两场发布会,我感到两家公司在这个领域有很大的突破。


但与此同时也存在一个很大的问题,我认为他们过度抬高了消费者对产品的期待值。同样的情况就出现在 2011 年 Siri 发布期间,当时苹果把 Siri 包装为一个充分理解用户感情的语音助手,导致很多用户预设 Siri 能像人一样聪明,结果与 Siri 语音交互时的效果并不好。而 Google Assistant 的产品定位就是一个冷冰冰的工具,我认为这是更明智的选择。因此无论是 GPT-4o 还是 Project Astra,它们所彰显的多模态和实时性特点,都会把用户的期望提得很高。


但真正的使用效果,依然需要观察。如果当一个硅谷以外的普通用户也能像发布的 Demo 里展示的那样使用流畅,那我认为人机交互的革命就真的到来了,甚至能引发下一波科技革命。过去很多革命都是因为人机交互设备或方式改变后诞生了新产品、新商业场景,并最终涌现出很多新的科技公司。


▲ Google 发布最新的多模态 AI 项目 Project Astra。| 图源:Google



声动活泼

Google 发布了多模态模型 Project Astra 意在与 GPT-4o 同台竞争,那么 Astra 是否比 GPT-4o 更胜一筹?


郑玉典

实际上,Google 的新模型还只是提前调试和录制好的 Demo,与真实投入使用的产品仍有差距与之相对,OpenAI 不仅录了好几段 Demo,还由专门人员在现场演示了 Demo 里的功能。这样对比来看,大家看了 OpenAI 再看 Google,确实不太有惊喜感。目前来看,OpenAI 仍然领先,因为它至少将 API 公布了出来,能使更多人受益。


李志飞

从技术能力和表现出的产品形态来看,两家公司其实半斤八两。毕竟从长期竞争过程来看,这两三个月的研发时间并不长。

在我看来,这类 AI 语音助手有几大类应用。第一类是闲聊,即表现得像一个真人,能够陪伴用户聊天;第二类是命令,即发布指令让助手帮你完成某项操作,这也是语音助手最常见的功能;第三大类则是回答信息或知识类的问题。

从这三个角度来说,在闲聊方面,OpenAI 肯定能做得很好,可以说 Google 的产品在某种程度上来说并不太会聊天但是命令类功能,尤其是在手机平台中,需要获得系统权限,跟硬件深度整合,相应的体验也会非常不一样。因此我认为 Google 未来的语音助手在这方面会有更大优势。

但事实上,闲聊和命令这两类对用户而言价值不一定大,信息知识类才是未来。信息和知识类是能基于上下文的,假如像 Google 这样的公司能够给语音助手提供更多不同应用的权限,那这些应用都可以成为语言大模型的上下文来源。它不再只是一个知识库,而是可以做得更加个性化。

作为一个语音助手,最核心的要求就在于无处不在、无所不能,如同一个私人秘书。基于这点,目前来看,Google 的生态系统足够完善,有海量的用户,每一个用户又基本上拥有很多数据,基于上下文就更可以做到个性化。所以这是我觉得 Google 相对于 OpenAI 来说,可能更加有优势的地方。





硅谷徐老师

Google 在发布会上同时发布了好几个新产品的 Demo。我们能够看到,这其实是一个很宽的产品线,从这个角度来看,OpenAI 是没有可比性的。


OpenAI 更多还是技术先行,至少我并不认为 OpenAI 是能够做很多产品的公司。但是 Google 已经开始炫技,秀肌肉。尽管目前更多的还是 Demo,并未落地,到最终实现商业化还有很长的路要走,但是至少它能够给大家展示出如此宽的 AI 产品线。


所以实际上 OpenAI 和 Google 是两个截然不同的形态。一个是技术先行,一个是大量产品先行,这是我认为此次展现出的比较明显的不同点。



郑玉典

如果用几个词来描述 OpenAI 和 Google 发布会,我认为 OpenAI 是「小而美」,主要面对开发者;Google 就是「大而全」。因为 Google 本来就有很大的生态,以及强大的操作系统等,目前就需要把自己的基本盘稳住,再逐渐进行 AI 渗透。对于 OpenAI 来说,看它是不是要和 Apple 集成,如果集成得好,对于 OpenAI 意味着很大的发展空间。



声动活泼

OpenAI 发布会中,有一支 Demo 展示了 AI 可以探测情绪的功能,这项功能在我们用户看来还是十分超前的。志飞你如何看待这项功能的技术难度呢?


▲ GPT-4o 指导演示人员如何深吸慢呼平复心情。| 图源:OpenAI



李志飞

从技术上来看,这对 Google 而言并没有太大难度。我们对于 Google 的技术水平应该保持基本的信仰,作为一家科技巨头必然有它的优势所在。但 Google 的确在组织效率等各种问题上需要不断追赶。


而且科技竞争肯定是一个长期的过程,在技术上不用太纠结谁先谁后。我比较担心的, 是 Google 产品的基因是否足够好,以及 Google 能否真正改变态度。从 Google 发布会就能看出,它依然把自己当作 AI 领域的 C 位,但其实在我们的这些外人看来,它已经是老二。作为老二,就应该表现得更加开放,甚至要激进一点,不能过于保守。


比如发布会本身,OpenAI 只花了不到半个小时就完成了演示,非常年轻化,而且效果也很好。然而Google 的发布会更像一个国企汇报会,无数产品部门、研发部门分别上台展示,最后花了两个多小时,但最终效果肯定不如前者。


以及这次 Google 发布会光是产品模型的名字可能就有二三十个,但 OpenAI 的主要产品就是 GPT-4o 和 Sora。这也表明这种大公司的内部需要平衡。从这个角度来看, Google 还是没有觉醒,它还是按照以前的惯性在做产品、做发布。



硅谷徐老师

我非常同意志飞提到的大公司「船大难掉头」的问题。但是我们还是要认可 Google 至今所做出的努力,Google 已经做了很多大刀阔斧的尝试与改革。






声动活泼

除了我们刚刚提到的是否与苹果等第三方进行集成的问题,OpenAI 目前还面临了哪些挑战?



李志飞

今天我们看 OpenAI 跟 Google 竞争,或者看 OpenAI 自身发展时,很多时候都在关注技术,这虽然很重要,但我认为最紧急的一个问题,在于 ChatGPT 是否是一个正确的产品,会员收费和 API 收费是否是一个正确的商业模式。


这两个问题才是决定 OpenAI 生与死的一点。关于 ChatGPT 是否是正确的产品,也就是说用户是否真的对这个产品有需求而且愿意持续使用。目前来看,OpenAI 的活跃用户不再增长。在渗透率还很低的情况下,说明这款产品其实并没有真正进入大众生活圈。


此外就是 OpenAI 的商业模式。目前一个是靠收会员费,另一个就是靠 API 收费。但会员营收迟早会消失,因为竞争越来越激烈,消费者是不会为这种东西付钱的,会员模式不一定能够持续。


而此后 API 领域的竞争者也会越来越多,还有小公司参与进来,那 API 只会越来越便宜,甚至可能慢慢逼近于零。所以这两个商业模式目前来看都不太可持续。


OpenAI 能否成功,就是看它能否在这两个问题上找到突破点,这也是它能否成为一个伟大的公司,或者说进入到下一个阶段的重要考验。


▲ GPT-4o 帮助盲人用户观察环境。| 图源:OpenAI



硅谷徐老师

我觉得这里面还有一个点,就是要看 OpenAI 和行业第二、第三的差距有多大。当Anthropic 和 Gemini 紧紧追赶,OpenAI 公司价值的领先地位是否能长久地保持下去?这是一个问题。



李志飞

尽管我们现在无法预判开源和闭源的终局。但是我觉得留给 OpenAI 的时间越来越少,尤其是在技术的迭代曲线上,OpenAI 没有像大家预测地那样一骑绝尘。而其他公司都达成了「All in AI」的共识,相信今后的社会资源,例如开源资源会越来越多,这是一个现状。


所以在我看来,OpenAI 的模型就算纯在技术层面也应该更加专注。当年 OpenAI 能够倾尽一个创业公司所有资源开发 GPT 1,乃至 GPT 3,我认为是非常厉害的决策。但如今来看,OpenAI 在很多事上都存在机会主义,或者说惯性动作。比如说发布 GPT Store,搞个新插件,这些在我看来就是浪费时间。包括前一阵子所说的 AI 搜索等产品,我觉得都已经晚了。


科技创业公司要想取得成果,从我自己创业的体感来说,时机特别重要,这也是非常残酷的一件事。有些东西的时间窗口一过,后续将会越发艰难。无论是 OpenAI 还是 Google,都应该有很强的危机感。当然我们作为普通群众,还是希望两家公司竞争得越厉害越好。



硅谷徐老师

如果 Google 大手笔把 Gemini 开源,那留给 OpenAI 的时间就没有了。好在对 OpenAI 来讲,它今天最大的竞争对手 Google 还没有那么高的觉悟。





有趣的是,就在这场对话结束后不久,360 集团创始人周鸿祎也发表了类似的观点,他说留给 Google 的时间不多了,建议把所有产品都开源。


OpenAI 与 Google 的 AI 竞赛,不仅是技术的较量,也考验着两家公司对产品价值和商业模式的理解与创新。能在多模态交互世界中真正赢得用户芳心的一方,或许也将决定未来科技的走向。


GPT-4o 和 Project Astra,你更看好哪一个?来评论区聊聊吧。






以上内容整理自

声动活泼旗下播客「科技早知道」

 想了解更多 AI 前沿动态 

 欢迎点击收听

也可在各大音频、播客平台搜索本期节目


监制/徐涛

编审/东君

设计/Mori

排版/Xinghan

运营/George


更多有趣问题

欢迎来声动活泼找答案


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI隐藏“王炸”,这一次要革Google的命?OpenAI:俩二;Google:四个王美国南方的三月:枇杷,中餐,满眼的杜鹃,及3月的海滩Google和OpenAI,又杠上了黄仁勋每天都用的 AI 产品,来自 Google,颠覆 Google大厂动态丨Google、Tesla裁员不停,Apple捞人不止!大模型降价,一场没有赢家的战争回国杂记(2307)高中毕业六十年校友相聚在武昌南湖Google,好有钱……大炮专家布尔Google,终究还是变味了网暴下的“胖猫之死”,没有赢家Google Glass 团队打磨 6 年的新产品,会是下一个翻车的 AI 硬件吗八年级的半夜1点,google doc里热热闹闹Google 真的是堕落到没眼看了新雨西雅图公交出行更便捷了!ORCA 卡 Google Wallet 上可用, 苹果用户还得等市区West Loop房源WL05 | 不收中介费/距离Google500米/UIC750米/2b$32xx起商科首选Apple,工科青睐Google,我们钟意你精选SDE岗位丨Cognizant、Google、Boeing持续热招!好消息!西雅图Orca交通卡可加入Google Wallet,iOS用户再等等发钱!每个家庭每月可拿1000美元现金!Google开始「撒钱」!?没有任何附加条件!必争之地丨Google、Open AI又一次对阵,谁赢了?挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富如果股市暂时没有答案当NG开始主动回国,没有赢家OpenAI releases realPerplexity认为Google、Meta、马斯克和整个世界都在抄袭它没有赢家的校园欺凌胖猫之死真相大白,恋爱开销账单明细曝光,但枪响之后已没有赢家扔掉小红书,国外自由行:Pokémon Go 和 Google Gemini 帮助打造最强旅游 Copilot熵泱——第五十一章跟 OpenAI 争夺「iPhone 合作权」的 Google,后天要发布什么才能 「弯道超车」OpenAI 自研 AI 芯片最新进展曝光,曾百万年薪挖角 Google 人才,或将挑战「英伟达霸权」华府消息|党内大佬暂时没有放弃拜登Google 手机设计细节曝光,苹果三星都没它显眼|Google 工业设计总监专访精选DS岗位丨Millennium、Netflix、Google等公司持续热招!Costco本周优惠:TCL 75英寸QLED 4K Google TV智能电视,$1349.99,省$1500!OpenAI 宣布终止对中国、朝鲜、俄罗斯等地区提供 API 服务,大家怎么看?OpenAI 首席科学家官宣离职/腾讯一季度净利润超500亿/Google 回击 GPT-4o,连发多款新品
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。