OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折
夕小瑶科技说 原创
编辑 | 夕小瑶编辑小伙伴们,我们几天前的推文《两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招》中承诺过:小编我会帮你们蹲点今天OpenAI发布会的!
小编我来兑现承诺了!
并且,这个大夜没白熬,这次发布会属实太炸裂了
先贴发布会视频(欢迎关注视频号,老粉后面会送福利!):
在这次OpenAI的发布会上,Mira Murati详细介绍了几项重要的更新和新功能:
新模型GPT-4o发布,免费开放!可实时语音交互,支持复杂视觉理解
GPT-4o是OpenAI的新旗舰模型,并且免费提供给用户使用。
Mira 解释说,过去几年中,OpenAI 一直专注于提升这一模型的智能水平,现在首次在易用性上取得了重大突破。
要知道,一年前的今天,GPT-4的对话价格还是几毛钱一条,仅仅一年,竟然免费了。这意味着GPT3.5级别能力的免费大模型将在市场上失去竞争力,毕竟GPT-4和GPT3.5的差距还是很大的。
从模型能力更新上来说,GPT-4o不仅加强了多语言支持,改进了对50种不同语言的处理质量和速度。而且,比较值得关注是其跨模态的能力升级。
其中,GPT-4o 的一大看点就是其具备了实时语音交互的能力,这意味着,你可以像跟真人通话一样去跟ChatGPT语音聊天了。而且,其在语音模式下具备包括讲话打断、即时反应和情感识别能力。
人与AI的界限被进一步模糊化了。
这种高阶的语音能力,将使得 GPT-4o 有望打破人机交互界面的局限性,未来的ChatGPT,可以无处不在——比如可以嵌入到没有屏幕的设备上随时交谈。总之,GPT-4o可以让人们更专注于与 ChatGPT 的协作,而不是受限于屏幕UI界面本身。
此外,GPT-4o 的视觉能力也得到了大幅强化。
GPT-4o 可整合处理视觉和文本信息——GPT-4o 能够同时处理和理解图像以及图像中包含的文本内容。这意味着用户可以上传包含文本的截图、照片或文档,GPT-4o能够识别并解析这些图像中的文字信息,与传统的文本输入方式无缝整合。
在发布会上,Mira展示了GPT-4o如何分析包含图文的复杂文档,并从中提取和利用信息。例如,用户可以上传含有表格和图像的商业报告,GPT-4o能够识别并处理其中的文本和视觉数据,为用户提供深入的内容分析。
针对开发者的GPT-4o API,价格便宜一半
除了向用户提供GPT-4o之外,OpenAI还将其作为API提供给开发者,这意味着开发者可以使用这一强大的模型来构建自己的应用程序,并且在速度、成本和功能上都有所提升。
而且,相比如今的GPT-4-Turbo系列API,GPT-4o不仅能力更强,速度更快,而且API价格也仅为前者的一半。
桌面版APP发布
发布会还宣布了桌面版 ChatGPT APP 的发布,这一版本旨在使用户界面更加简单自然,提升用户体验。
大模型友商:残酷打击
我觉得在这场发布会之后,最崩溃的就是OpenAI的竞争对手了——尤其是国外的大模型厂商。当大家还在不计成本的苦苦研究如何真正追上GPT-4的体验的时候,竞争对手竟然直接将这个模型免费开放给用户使用了。
这对友商来说,可以说是一个非常残酷的打击。
尽管OpenAI当下最为强有力的竞争对手Anthropic发布的Claude 3 Opus已经在体验上超越了GPT-4,并且其在用户端积累了一定的共识,但Claude 3 Opus的价格相比GPT-4非常昂贵,且不稳定,经常出现无法连接的情况。
如果GPT-4o真的效果显著反超了Claude 3 Opus而且还免费,那么可以说Anthropic弯道超车的可能性就更加渺茫了。
具身智能爆发前夜?
不要小看了这次的语音交互能力的升级。要知道,如今各大厂的语音交互的体验,都与真人的语音交互差的非常远。
比如有的需要用固定的唤醒词,有的语音识别非常不准,而且普遍语义理解能力非常有限,更为重要的是,如今的语音产品普遍不具备类人的对话打断和情感能力,这使得真实使用的时候非常恼人——你明知他在胡说八道了,骂它一顿结果它还听不懂,甚至它还在那儿自说自话停不下来。
而GPT-4o的发布,使得这个糟糕的体验有望出现大幅转折——人工智障时代可能要结束了。如果体验真如发布会所称的这么好,那么毫无疑问,这对于智能硬件行业是一个不小的变量。
具身智能也从此有了更和谐的交互能力,人与AI的距离被极大的拉近了。
AI应用生态的爆发催化剂
值得注意的是,GPT-4系列的API价格正在以远超摩尔定律的速度疯狂降价,这意味着先进AI的访问成本将快速的、无限的接近0。
由此,未来开发者将有能力支撑起巨大C端访问量的复杂AI原生应用,而不会像如今一样,为了覆盖成本,只能收费使用。而一旦收费,这个应用的门槛将极大的提升,网络效应难以成立,破圈的可能性将极大的降低。
GPT-4o不仅玩法上给AI原生应用提供了更多可能性,访问成本的大幅降低,可能会进一步催生AI应用生态的爆发。
2024下半年,将是一个非常令人期待的时代。
微信扫码关注该文公众号作者