Redian新闻
>
OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

公众号新闻

夕小瑶科技说 原创
编辑 | 夕小瑶编辑
小伙伴们,我们几天前的推文《两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招》中承诺过:小编我会帮你们蹲点今天OpenAI发布会的!

小编我来兑现承诺了!

并且,这个大夜没白熬,这次发布会属实太炸裂了

先贴发布会视频(欢迎关注视频号,老粉后面会送福利!):

在这次OpenAI的发布会上,Mira Murati详细介绍了几项重要的更新和新功能:

  1. 新模型GPT-4o发布,免费开放!可实时语音交互,支持复杂视觉理解

GPT-4o是OpenAI的新旗舰模型,并且免费提供给用户使用。

Mira 解释说,过去几年中,OpenAI 一直专注于提升这一模型的智能水平,现在首次在易用性上取得了重大突破。

要知道,一年前的今天,GPT-4的对话价格还是几毛钱一条,仅仅一年,竟然免费了。这意味着GPT3.5级别能力的免费大模型将在市场上失去竞争力,毕竟GPT-4和GPT3.5的差距还是很大的。

从模型能力更新上来说,GPT-4o不仅加强了多语言支持,改进了对50种不同语言的处理质量和速度。而且,比较值得关注是其跨模态的能力升级。

其中,GPT-4o 的一大看点就是其具备了实时语音交互的能力,这意味着,你可以像跟真人通话一样去跟ChatGPT语音聊天了。而且,其在语音模式下具备包括讲话打断、即时反应和情感识别能力。

人与AI的界限被进一步模糊化了。

这种高阶的语音能力,将使得 GPT-4o 有望打破人机交互界面的局限性,未来的ChatGPT,可以无处不在——比如可以嵌入到没有屏幕的设备上随时交谈。总之,GPT-4o可以让人们更专注于与 ChatGPT 的协作,而不是受限于屏幕UI界面本身。

此外,GPT-4o 的视觉能力也得到了大幅强化。

GPT-4o 可整合处理视觉和文本信息——GPT-4o 能够同时处理和理解图像以及图像中包含的文本内容。这意味着用户可以上传包含文本的截图、照片或文档,GPT-4o能够识别并解析这些图像中的文字信息,与传统的文本输入方式无缝整合。

在发布会上,Mira展示了GPT-4o如何分析包含图文的复杂文档,并从中提取和利用信息。例如,用户可以上传含有表格和图像的商业报告,GPT-4o能够识别并处理其中的文本和视觉数据,为用户提供深入的内容分析。

  1. 针对开发者的GPT-4o API,价格便宜一半

除了向用户提供GPT-4o之外,OpenAI还将其作为API提供给开发者,这意味着开发者可以使用这一强大的模型来构建自己的应用程序,并且在速度、成本和功能上都有所提升。

而且,相比如今的GPT-4-Turbo系列API,GPT-4o不仅能力更强,速度更快,而且API价格也仅为前者的一半。

  1. 桌面版APP发布

发布会还宣布了桌面版 ChatGPT APP 的发布,这一版本旨在使用户界面更加简单自然,提升用户体验。

大模型友商:残酷打击

我觉得在这场发布会之后,最崩溃的就是OpenAI的竞争对手了——尤其是国外的大模型厂商。当大家还在不计成本的苦苦研究如何真正追上GPT-4的体验的时候,竞争对手竟然直接将这个模型免费开放给用户使用了。

这对友商来说,可以说是一个非常残酷的打击。

尽管OpenAI当下最为强有力的竞争对手Anthropic发布的Claude 3 Opus已经在体验上超越了GPT-4,并且其在用户端积累了一定的共识,但Claude 3 Opus的价格相比GPT-4非常昂贵,且不稳定,经常出现无法连接的情况。

如果GPT-4o真的效果显著反超了Claude 3 Opus而且还免费,那么可以说Anthropic弯道超车的可能性就更加渺茫了。

具身智能爆发前夜?

不要小看了这次的语音交互能力的升级。要知道,如今各大厂的语音交互的体验,都与真人的语音交互差的非常远。

比如有的需要用固定的唤醒词,有的语音识别非常不准,而且普遍语义理解能力非常有限,更为重要的是,如今的语音产品普遍不具备类人的对话打断和情感能力,这使得真实使用的时候非常恼人——你明知他在胡说八道了,骂它一顿结果它还听不懂,甚至它还在那儿自说自话停不下来。

而GPT-4o的发布,使得这个糟糕的体验有望出现大幅转折——人工智障时代可能要结束了。如果体验真如发布会所称的这么好,那么毫无疑问,这对于智能硬件行业是一个不小的变量。

具身智能也从此有了更和谐的交互能力,人与AI的距离被极大的拉近了。

AI应用生态的爆发催化剂

值得注意的是,GPT-4系列的API价格正在以远超摩尔定律的速度疯狂降价,这意味着先进AI的访问成本将快速的、无限的接近0。

由此,未来开发者将有能力支撑起巨大C端访问量的复杂AI原生应用,而不会像如今一样,为了覆盖成本,只能收费使用。而一旦收费,这个应用的门槛将极大的提升,网络效应难以成立,破圈的可能性将极大的降低。

GPT-4o不仅玩法上给AI原生应用提供了更多可能性,访问成本的大幅降低,可能会进一步催生AI应用生态的爆发。

2024下半年,将是一个非常令人期待的时代。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发微软昨夜AI全家桶狂飙:GPT-4o上云,纳德拉现场表白OpenAI,Altman剧透新模型OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4oAlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了GPT-4o发布!AI实时视频通话丝滑如人类,Plus功能免费使用OpenAI王炸更新GPT-4o,干掉所有语音助手!丝滑如真人引爆全网科幻成真!【行业日报】 OpenAI推出新人工智能模型GPT-4o!沃尔玛计划裁减数百名公司员工!GPT-4o发布,产品经理如何应对即将到来的“钢铁侠贾维斯助理”时代?OpenAI再压谷歌一头,最强模型GPT-4o免费发布,语言对话媲美人类反应全能模型GPT-4o惊艳发布!AI可提供情绪价值,还结婚么?无可奈何花落去:“友情”在消亡?春天的魅力OpenAI发布新旗舰模型GPT-4o;字节跳动正式发布豆包大模型|AIGC周观察第四十三期蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明OpenAI发布全新模型GPT-4o;麦当劳回应使用过期食材;王化回应小米 SU7 刹车故障;璩静离职后发声...OpenAI掌门人最新专访:GPT-4o让我爱不释手 下代大模型可能不叫GPT-5OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了Mac 版 GPT-4o 语音交互现场演示来了,与 \bSora 梦幻联动,新模型更多细节曝光微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报昇腾社区回应网传华为发布会大模型生成图片系人工操控;Sam Altman:新款语音模型GPT-4o尚未发货丨AIGC日报OpenAI深夜炸场,GPT-4o干翻所有语音助手!麦当劳回应使用过期食材:深表歉意;璩静离职后发声丨邦早报GPT绝地反击!超5000只个股上涨,微盘股指数狂飙8%!热门赛道再度起飞,20%涨停一大片...我为何不喜欢网络辩论:深入探讨虚拟争吵的背后马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型拾起久远的记忆:学习女红(gong)OpenAI发布全新模型GPT-4o;淘宝改版首页:频道入口由三栏变双栏呈现……我们的那些故事(剧终)华为余承东称传统车企流量根本干不过小米/阿里打骨折,百度免费,大模型掀降价潮/微软发布 50+ 重磅更新
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。