Redian新闻
>
OpenAI 与 Google,暂时没有赢家

OpenAI 与 Google,暂时没有赢家

公众号新闻

两位劲敌在 AI 赛场上正面交锋的场景再次出现。


5 月 14 日,OpenAI 在产品发布会上发布了最新的 GPT-4o 多模态大模型,具有实时的语音、视频和文本交互能力。而就在这场发布会结束后的第二天,Google 也举办了 2024 年 I/O 开发者大会,一口气发布了好几款 AI 产品,其中最引发关注的是与 GTP-4o 对标的 Project Astra。


谁会胜出?


两位 AI 领域的创业者——出门问问创始人兼 CEO 李志飞与受邀参加 OpenAI 发布会的 jobright.ai 联合创始人郑玉典,对于这个话题给出了一个有趣的观点,那就是留给 Google 和 OpenAI 两大巨头的时间都不多了。为什么会得出这样的结论?以下是与他们的对话。


文末还有完整对话音频,也可在各大音频、播客平台搜索「科技早知道」收听,不要错过。






声动活泼

玉典受邀参加了此次 OpenAI 发布会,能否分享一下你在现场的感受?



郑玉典

Open AI 这次发布会规模并不大,只有 40 多人参加,CEO 山姆·阿尔特曼(Sam Altman)没有上台发言,并且在发布会结束后很快离开了。



▲ OpenAI CEO 山姆·阿尔特曼在发布会现场。| 郑玉典 摄


发布会 95% 的时间都在介绍 GPT-4o 模型。GPT-4o 的 o 代表 omni(意为全能),用 OpenAI 官方的话说,这是它们目前最先进的旗舰版多模态模型。


OpenAI 此前的模型主要是以文字、图片和音频为主,GPT-4o 新增了一个视频维度,也就是说它的输入可以是文字、图片、音频和视频,输出可以支持文字、图片和音频。


此外最关键的一点,是该模型是面向开发者的,可以供开发者使用。


▲ OpenAI 发布会直接在公司办公室举行。| 图源:OpenAI



声动活泼

就在 Open AI 发布会的后一天,谷歌举办了 Google I/O 大会,发布了 Project Astra。志飞在 NLP 人机交互,以及虚拟个人助理(VPA)等领域深耕了数十年。你如何看待这两家公司的产品?



李志飞

这两家科技巨头此次发布会聚焦人机交互,在发布的大模型中,重要的关键词就是多模态和实时。这也是人机交互里非常重要的两个维度。


在此之前的 Siri、Google Assistant,包括国内的各种语音助手,基本上只是语音交互系统,无法集成图片、视频,更不可能集成在一个模型里。但人的交互方式就是多模态的,我们在聊天的过程中,我不仅可以看着你说话,也能注意到周边的环境,这就是一个典型的多模态交互过程。过去并没有这种真正的多模态交互助理,因此看完这两场发布会,我感到两家公司在这个领域有很大的突破。


但与此同时也存在一个很大的问题,我认为他们过度抬高了消费者对产品的期待值。同样的情况就出现在 2011 年 Siri 发布期间,当时苹果把 Siri 包装为一个充分理解用户感情的语音助手,导致很多用户预设 Siri 能像人一样聪明,结果与 Siri 语音交互时的效果并不好。而 Google Assistant 的产品定位就是一个冷冰冰的工具,我认为这是更明智的选择。因此无论是 GPT-4o 还是 Project Astra,它们所彰显的多模态和实时性特点,都会把用户的期望提得很高。


但真正的使用效果,依然需要观察。如果当一个硅谷以外的普通用户也能像发布的 Demo 里展示的那样使用流畅,那我认为人机交互的革命就真的到来了,甚至能引发下一波科技革命。过去很多革命都是因为人机交互设备或方式改变后诞生了新产品、新商业场景,并最终涌现出很多新的科技公司。


▲ Google 发布最新的多模态 AI 项目 Project Astra。| 图源:Google



声动活泼

Google 发布了多模态模型 Project Astra 意在与 GPT-4o 同台竞争,那么 Astra 是否比 GPT-4o 更胜一筹?


郑玉典

实际上,Google 的新模型还只是提前调试和录制好的 Demo,与真实投入使用的产品仍有差距与之相对,OpenAI 不仅录了好几段 Demo,还由专门人员在现场演示了 Demo 里的功能。这样对比来看,大家看了 OpenAI 再看 Google,确实不太有惊喜感。目前来看,OpenAI 仍然领先,因为它至少将 API 公布了出来,能使更多人受益。


李志飞

从技术能力和表现出的产品形态来看,两家公司其实半斤八两。毕竟从长期竞争过程来看,这两三个月的研发时间并不长。

在我看来,这类 AI 语音助手有几大类应用。第一类是闲聊,即表现得像一个真人,能够陪伴用户聊天;第二类是命令,即发布指令让助手帮你完成某项操作,这也是语音助手最常见的功能;第三大类则是回答信息或知识类的问题。

从这三个角度来说,在闲聊方面,OpenAI 肯定能做得很好,可以说 Google 的产品在某种程度上来说并不太会聊天但是命令类功能,尤其是在手机平台中,需要获得系统权限,跟硬件深度整合,相应的体验也会非常不一样。因此我认为 Google 未来的语音助手在这方面会有更大优势。

但事实上,闲聊和命令这两类对用户而言价值不一定大,信息知识类才是未来。信息和知识类是能基于上下文的,假如像 Google 这样的公司能够给语音助手提供更多不同应用的权限,那这些应用都可以成为语言大模型的上下文来源。它不再只是一个知识库,而是可以做得更加个性化。

作为一个语音助手,最核心的要求就在于无处不在、无所不能,如同一个私人秘书。基于这点,目前来看,Google 的生态系统足够完善,有海量的用户,每一个用户又基本上拥有很多数据,基于上下文就更可以做到个性化。所以这是我觉得 Google 相对于 OpenAI 来说,可能更加有优势的地方。





硅谷徐老师

Google 在发布会上同时发布了好几个新产品的 Demo。我们能够看到,这其实是一个很宽的产品线,从这个角度来看,OpenAI 是没有可比性的。


OpenAI 更多还是技术先行,至少我并不认为 OpenAI 是能够做很多产品的公司。但是 Google 已经开始炫技,秀肌肉。尽管目前更多的还是 Demo,并未落地,到最终实现商业化还有很长的路要走,但是至少它能够给大家展示出如此宽的 AI 产品线。


所以实际上 OpenAI 和 Google 是两个截然不同的形态。一个是技术先行,一个是大量产品先行,这是我认为此次展现出的比较明显的不同点。



郑玉典

如果用几个词来描述 OpenAI 和 Google 发布会,我认为 OpenAI 是「小而美」,主要面对开发者;Google 就是「大而全」。因为 Google 本来就有很大的生态,以及强大的操作系统等,目前就需要把自己的基本盘稳住,再逐渐进行 AI 渗透。对于 OpenAI 来说,看它是不是要和 Apple 集成,如果集成得好,对于 OpenAI 意味着很大的发展空间。



声动活泼

OpenAI 发布会中,有一支 Demo 展示了 AI 可以探测情绪的功能,这项功能在我们用户看来还是十分超前的。志飞你如何看待这项功能的技术难度呢?


▲ GPT-4o 指导演示人员如何深吸慢呼平复心情。| 图源:OpenAI



李志飞

从技术上来看,这对 Google 而言并没有太大难度。我们对于 Google 的技术水平应该保持基本的信仰,作为一家科技巨头必然有它的优势所在。但 Google 的确在组织效率等各种问题上需要不断追赶。


而且科技竞争肯定是一个长期的过程,在技术上不用太纠结谁先谁后。我比较担心的, 是 Google 产品的基因是否足够好,以及 Google 能否真正改变态度。从 Google 发布会就能看出,它依然把自己当作 AI 领域的 C 位,但其实在我们的这些外人看来,它已经是老二。作为老二,就应该表现得更加开放,甚至要激进一点,不能过于保守。


比如发布会本身,OpenAI 只花了不到半个小时就完成了演示,非常年轻化,而且效果也很好。然而Google 的发布会更像一个国企汇报会,无数产品部门、研发部门分别上台展示,最后花了两个多小时,但最终效果肯定不如前者。


以及这次 Google 发布会光是产品模型的名字可能就有二三十个,但 OpenAI 的主要产品就是 GPT-4o 和 Sora。这也表明这种大公司的内部需要平衡。从这个角度来看, Google 还是没有觉醒,它还是按照以前的惯性在做产品、做发布。



硅谷徐老师

我非常同意志飞提到的大公司「船大难掉头」的问题。但是我们还是要认可 Google 至今所做出的努力,Google 已经做了很多大刀阔斧的尝试与改革。






声动活泼

除了我们刚刚提到的是否与苹果等第三方进行集成的问题,OpenAI 目前还面临了哪些挑战?



李志飞

今天我们看 OpenAI 跟 Google 竞争,或者看 OpenAI 自身发展时,很多时候都在关注技术,这虽然很重要,但我认为最紧急的一个问题,在于 ChatGPT 是否是一个正确的产品,会员收费和 API 收费是否是一个正确的商业模式。


这两个问题才是决定 OpenAI 生与死的一点。关于 ChatGPT 是否是正确的产品,也就是说用户是否真的对这个产品有需求而且愿意持续使用。目前来看,OpenAI 的活跃用户不再增长。在渗透率还很低的情况下,说明这款产品其实并没有真正进入大众生活圈。


此外就是 OpenAI 的商业模式。目前一个是靠收会员费,另一个就是靠 API 收费。但会员营收迟早会消失,因为竞争越来越激烈,消费者是不会为这种东西付钱的,会员模式不一定能够持续。


而此后 API 领域的竞争者也会越来越多,还有小公司参与进来,那 API 只会越来越便宜,甚至可能慢慢逼近于零。所以这两个商业模式目前来看都不太可持续。


OpenAI 能否成功,就是看它能否在这两个问题上找到突破点,这也是它能否成为一个伟大的公司,或者说进入到下一个阶段的重要考验。


▲ GPT-4o 帮助盲人用户观察环境。| 图源:OpenAI



硅谷徐老师

我觉得这里面还有一个点,就是要看 OpenAI 和行业第二、第三的差距有多大。当Anthropic 和 Gemini 紧紧追赶,OpenAI 公司价值的领先地位是否能长久地保持下去?这是一个问题。



李志飞

尽管我们现在无法预判开源和闭源的终局。但是我觉得留给 OpenAI 的时间越来越少,尤其是在技术的迭代曲线上,OpenAI 没有像大家预测地那样一骑绝尘。而其他公司都达成了「All in AI」的共识,相信今后的社会资源,例如开源资源会越来越多,这是一个现状。


所以在我看来,OpenAI 的模型就算纯在技术层面也应该更加专注。当年 OpenAI 能够倾尽一个创业公司所有资源开发 GPT 1,乃至 GPT 3,我认为是非常厉害的决策。但如今来看,OpenAI 在很多事上都存在机会主义,或者说惯性动作。比如说发布 GPT Store,搞个新插件,这些在我看来就是浪费时间。包括前一阵子所说的 AI 搜索等产品,我觉得都已经晚了。


科技创业公司要想取得成果,从我自己创业的体感来说,时机特别重要,这也是非常残酷的一件事。有些东西的时间窗口一过,后续将会越发艰难。无论是 OpenAI 还是 Google,都应该有很强的危机感。当然我们作为普通群众,还是希望两家公司竞争得越厉害越好。



硅谷徐老师

如果 Google 大手笔把 Gemini 开源,那留给 OpenAI 的时间就没有了。好在对 OpenAI 来讲,它今天最大的竞争对手 Google 还没有那么高的觉悟。





有趣的是,就在这场对话结束后不久,360 集团创始人周鸿祎也发表了类似的观点,他说留给 Google 的时间不多了,建议把所有产品都开源。


OpenAI 与 Google 的 AI 竞赛,不仅是技术的较量,也考验着两家公司对产品价值和商业模式的理解与创新。能在多模态交互世界中真正赢得用户芳心的一方,或许也将决定未来科技的走向。


GPT-4o 和 Project Astra,你更看好哪一个?来评论区聊聊吧。






以上内容整理自

声动活泼旗下播客「科技早知道」

 想了解更多 AI 前沿动态 

 欢迎点击收听

也可在各大音频、播客平台搜索本期节目


监制/徐涛

编审/东君

设计/Mori

排版/Xinghan

运营/George


更多有趣问题

欢迎来声动活泼找答案


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
美国南方的三月:枇杷,中餐,满眼的杜鹃,及3月的海滩Costco本周优惠:TCL 75英寸QLED 4K Google TV智能电视,$1349.99,省$1500!精选SDE岗位丨Cognizant、Google、Boeing持续热招!Google Glass 团队打磨 6 年的新产品,会是下一个翻车的 AI 硬件吗好消息!西雅图Orca交通卡可加入Google Wallet,iOS用户再等等OpenAI隐藏“王炸”,这一次要革Google的命?必争之地丨Google、Open AI又一次对阵,谁赢了?OpenAI:俩二;Google:四个王发钱!每个家庭每月可拿1000美元现金!Google开始「撒钱」!?没有任何附加条件!Google和OpenAI,又杠上了挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富OpenAI 自研 AI 芯片最新进展曝光,曾百万年薪挖角 Google 人才,或将挑战「英伟达霸权」OpenAI 宣布终止对中国、朝鲜、俄罗斯等地区提供 API 服务,大家怎么看?精选DS岗位丨Millennium、Netflix、Google等公司持续热招!没有赢家的校园欺凌西雅图公交出行更便捷了!ORCA 卡 Google Wallet 上可用, 苹果用户还得等跟 OpenAI 争夺「iPhone 合作权」的 Google,后天要发布什么才能 「弯道超车」网暴下的“胖猫之死”,没有赢家扔掉小红书,国外自由行:Pokémon Go 和 Google Gemini 帮助打造最强旅游 Copilot大炮专家布尔回国杂记(2307)高中毕业六十年校友相聚在武昌南湖如果股市暂时没有答案市区West Loop房源WL05 | 不收中介费/距离Google500米/UIC750米/2b$32xx起OpenAI 首席科学家官宣离职/腾讯一季度净利润超500亿/Google 回击 GPT-4o,连发多款新品黄仁勋每天都用的 AI 产品,来自 Google,颠覆 GoogleGoogle,好有钱……Google 真的是堕落到没眼看了Google 手机设计细节曝光,苹果三星都没它显眼|Google 工业设计总监专访新雨熵泱——第五十一章OpenAI releases realGoogle,终究还是变味了Perplexity认为Google、Meta、马斯克和整个世界都在抄袭它大厂动态丨Google、Tesla裁员不停,Apple捞人不止!当NG开始主动回国,没有赢家八年级的半夜1点,google doc里热热闹闹胖猫之死真相大白,恋爱开销账单明细曝光,但枪响之后已没有赢家大模型降价,一场没有赢家的战争商科首选Apple,工科青睐Google,我们钟意你华府消息|党内大佬暂时没有放弃拜登
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。