Redian新闻
>
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见

OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见

公众号新闻

曝已与苹果达成合作,ChatGPT或集成至iOS 18。
作者 |  香草
编辑 |  李水青
智东西5月11日消息,今天凌晨,OpenAI宣布将于美国时间13日上午10点(北京时间14日凌晨1点)在官网直播,演示ChatGPT、GPT-4的更新内容。
据外媒The Information今日报道,OpenAI正在构建具备音频和视觉理解能力AI语音助手,其中一些功能已经开始向客户展示,可能在下周的发布活动中预览。
知情人士消息透露,OpenAI可能会在今年内完成GPT-5的开发并公开发布。此外,OpenAI还计划推出一种新的定价模式,客户通过预付费预定Token,最高可以享受50%的折扣。
此前有多家外媒和博主曝料,称OpenAI将在近日发布AI搜索引擎。其CEO阿尔特曼对此回应道:“不是GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为会得到喜欢的新东西。”

▲阿尔特曼回应新品演示(图源:X)

值得注意的是,其竞争对手谷歌的I/O开发者大会时间定在美国时间14日上午10点(北京时间15日凌晨1点),预计可能发布Gemini大模型的重要更新。OpenAI此次发布时间没有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大会的前一天,火药味可谓浓厚。
要知道,这已经不是OpenAI第一次“卡点”狙击谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,结果没过几个小时,OpenAI就掏出文生视频“王炸”模型Sora,狠狠抢了Gemini 1.5 Pro的风头。
直播发布地址:http://openai.com

01.
AI语音助手仍存在“幻觉”问题
或将集成至ChatGPT免费版


The Information报道,阿尔特曼的终极目标是开发出类似电影《她》(Her)中,可高度响应的虚拟助手,提升苹果Siri等现有语音助手的可用程度。

▲电影《她》剧照

OpenAI认为,具有视觉和音频功能的AI语音助手具有像智能手机一样的变革性潜力,理论上其可以做到一系列现在的AI助手无法做到的事,例如充当论文、数学问题指导老师,或是翻译交通标识、帮助解决汽车故障等。
但类似的技术目前所需硬件门槛太高,无法在个人设备上运行,用户可以在短期内使用基于云的版本来获取这些功能,例如自动化客户服务Agent。
OpenAI目前已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话AI模型实现,而新的语音助手则将这些功能整合在一起。据知情人士透露,该AI语音助手的音频功能能够帮助客服人员更好地理解对方的语气。
目前尚不清楚OpenAI何时向付费客户提供这些新功能,但据试用过该语音助手的人士透露,OpenAI最终的计划是将这些功能都纳入ChatGPT免费版本,目标是比目前其最先进模型GPT-4 Turbo的运行成本更低。该人士还谈道,AI语音助手在有些类型的问题上回答优于GPT-4 Turbo,但仍然存在幻觉问题。
对此,OpenAI发言人没有回应置评请求。

02.
与谷歌竞争iPhone合作位
GPT-5或于年底前发布


OpenAI推出AI语音助手主要目标是与谷歌竞争。
谷歌的AI模型Gemini能实时响应语音命令,并识别图像、视频等。不过这些功能目前仍需要研究人员附以图像和文字说明,且并不能理解许多传统的语音指令,也不能像Siri和谷歌助手等传统语音助手那样与用户对话。

▲谷歌展示Gemini多模态功能(图源:谷歌)

另一方面,提高模型的视觉、音频能力也有助于OpenAI与苹果达成合作。
最近几个月,苹果与OpenAI就下一代iPhone操作系统如何整合OpenAI的模型进行了讨论。然而,与此同时,苹果也与谷歌进行着类似的谈判。
这场竞争的最新消息是,据彭博社今早报道,苹果已接近与OpenAI达成协议,将在下一代iPhone操作系统iOS 18中使用ChatGPT;与谷歌尚未达成协议,但谈判仍在进行中
除了可能在下周推出的AI语音助手外,OpenAI还一直致力于构建一款AI搜索引擎,旨在与谷歌竞争。此外,其也在开发一种被称作“计算机使用Agent”的自动化软件,用来辅助软件开发和其他计算机任务。
阿尔特曼还在与iPhone开发者乔尼·艾维(Jony Ive)合作开发一款独立的AI硬件。然而,最先进的AI模型体积庞大,需要在云端运行,并需要互联网连接才能工作。要使具有视觉和听觉功能的复杂AI模型变得足够小巧,以便在设备上运行,可能需要几个月甚至几年的时间。
不过,大家最关心的可能还是GPT-5。据The Information报道,一位接近OpenAI领导人的人士称,其可能在今年年底完成GPT-5并公开发布
OpenAI的新产品和AI模型开发工作进展得如火如荼,与此同时,其此前宣布的一些项目却变得不再那么受关注。尽管OpenAI曾向开发者承诺,会在今年第一季度推出GPT Store开发者激励计划,但目前仍没有实现。

03.
计划推出预付费定价模式
最高提供50%折扣


在定价方面,据知情人士透露,OpenAI计划推出一种新的定价模式,如果客户通过预付费预定Token,最高可以享受50%的折扣。
这样的优惠形式在云计算领域比较常见,微软Azure、谷歌云、亚马逊云服务(AWS)等都提供提前预定服务器容量折扣的方式来降低成本。
目前,按需定价提供API(应用程序接口)是OpenAI大模型的主要付费形式,通过每生成100万Tokens,向开发者收取几美分至一百多美分不等的费用,其中大客户可以享受批量折扣。
此前OpenAI已经提供了一种降低开发者成本的方式,其在4月推出Batch API,如果开发者批量上传模型查询,并接受等待最长24小时的时间,就可以获取更低的价格。
Together AI和Anyscale等AI服务器经销商曾表示,在他们的软件上运行开源模型要比使用OpenAI的模型便宜6倍。通过更灵活的定价,OpenAI与其他模型开发商的竞争将更具优势。据透露,其今年的营收可能达到数十亿美元。

04.
结语:OpenAI谷歌相争
苹果微软得利?


OpenAI与谷歌之间的竞争愈发激烈,二者之间的“商战”火药味也愈发浓厚。OpenAI又一次将新品发布时间定在了谷歌重大发布时间附近,似乎执着于抢夺谷歌风头这件事。
这一边,苹果同时与OpenAI、谷歌商谈模型集成至iPhone事宜,再次加剧了两家公司之间的竞争。虽然OpenAI被曝已与苹果达成合作,但谷歌那边的谈判也仍在继续。
而另一边,微软作为OpenAI最大的财务支持者,可以优先使用其先进技术来改进自己的语音助手。而微软也并非“孤注一掷”,除了积极自研模型外,还投资了OpenAI有力竞对Mistral AI,后者成为第二家在微软Azure云平台上提供商业AI模型的公司。
下周的OpenAI新品发布和谷歌I/O大会,或许会将这场“商战”推向新高度。究竟谁的“大招”会更厉害,我们拭目以待。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
北雁南飞入悉尼(5)OpenAI王炸更新GPT-4o,干掉所有语音助手!丝滑如真人引爆全网科幻成真!OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真你的超级知识助手来了!讯飞星火支持长文本长图文长语音,生产力直线UPOpenAI谷歌苹果再燃AI争霸战,谁将担纲「Her」时代王者?OpenAI 官宣下周发布更新/李彦宏评璩静风波:优秀员工才代表真实的百度/TikTok 将自动标记第三方 AI 生成内容黄仁勋超2万字演讲:要打破摩尔定律,官宣下一代GPU架构ChatGPT 语音模式酷似「寡姐」?OpenAI 刚刚发文回应微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观扎克伯格出手狙击OpenAI,大模型竞赛再升级巴菲特称芒格拍桌子让他买比亚迪/ ​OpenAI下周或发布ChatGPT搜索引擎,挑战谷歌丨36氪出海·要闻回顾百度内部高管评论璩静风波/OpenAI 官宣下周发布更新/极氪登陆纽约证券交易所惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发昨晚,谷歌发布「AI 超级全家桶」,但最大的创新却被 OpenAI 狙击了两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招燃! OpenAI谷歌苹果AI争霸战再次打响! 对留学生的利好消息是...OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人?花生糖OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片OpenAI深夜炸场,GPT-4o干翻所有语音助手!麦当劳回应使用过期食材:深表歉意;璩静离职后发声丨邦早报你经常用手机语音助手吗?OpenAI 下周发布的大更新,可能比 GPT-5 更值得期待17、长篇家庭伦理小说《嫁接 下》第五章 志同道合(2)Copilot功能大礼包!微软让个人AI助手进入团队,GPT-4o现已助力Azure,浏览器视频实时翻译GPT都说谷歌被OpenAI狙击了,我怎么觉得它在狙苹果。。。等鱼AI搜索引擎来了!谷歌放大招,发布最强AI模型,语音功能正面刚OpenAIOpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代The living room projects -- hutch and muralGPT-4o炸裂登场,干翻所有语音助手!GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。