Redian新闻
>
OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折

公众号新闻

夕小瑶科技说 原创
编辑 | 夕小瑶编辑
小伙伴们,我们几天前的推文《两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招》中承诺过:小编我会帮你们蹲点今天OpenAI发布会的!

小编我来兑现承诺了!

并且,这个大夜没白熬,这次发布会属实太炸裂了

先贴发布会视频(欢迎关注视频号,老粉后面会送福利!):

在这次OpenAI的发布会上,Mira Murati详细介绍了几项重要的更新和新功能:

  1. 新模型GPT-4o发布,免费开放!可实时语音交互,支持复杂视觉理解

GPT-4o是OpenAI的新旗舰模型,并且免费提供给用户使用。

Mira 解释说,过去几年中,OpenAI 一直专注于提升这一模型的智能水平,现在首次在易用性上取得了重大突破。

要知道,一年前的今天,GPT-4的对话价格还是几毛钱一条,仅仅一年,竟然免费了。这意味着GPT3.5级别能力的免费大模型将在市场上失去竞争力,毕竟GPT-4和GPT3.5的差距还是很大的。

从模型能力更新上来说,GPT-4o不仅加强了多语言支持,改进了对50种不同语言的处理质量和速度。而且,比较值得关注是其跨模态的能力升级。

其中,GPT-4o 的一大看点就是其具备了实时语音交互的能力,这意味着,你可以像跟真人通话一样去跟ChatGPT语音聊天了。而且,其在语音模式下具备包括讲话打断、即时反应和情感识别能力。

人与AI的界限被进一步模糊化了。

这种高阶的语音能力,将使得 GPT-4o 有望打破人机交互界面的局限性,未来的ChatGPT,可以无处不在——比如可以嵌入到没有屏幕的设备上随时交谈。总之,GPT-4o可以让人们更专注于与 ChatGPT 的协作,而不是受限于屏幕UI界面本身。

此外,GPT-4o 的视觉能力也得到了大幅强化。

GPT-4o 可整合处理视觉和文本信息——GPT-4o 能够同时处理和理解图像以及图像中包含的文本内容。这意味着用户可以上传包含文本的截图、照片或文档,GPT-4o能够识别并解析这些图像中的文字信息,与传统的文本输入方式无缝整合。

在发布会上,Mira展示了GPT-4o如何分析包含图文的复杂文档,并从中提取和利用信息。例如,用户可以上传含有表格和图像的商业报告,GPT-4o能够识别并处理其中的文本和视觉数据,为用户提供深入的内容分析。

  1. 针对开发者的GPT-4o API,价格便宜一半

除了向用户提供GPT-4o之外,OpenAI还将其作为API提供给开发者,这意味着开发者可以使用这一强大的模型来构建自己的应用程序,并且在速度、成本和功能上都有所提升。

而且,相比如今的GPT-4-Turbo系列API,GPT-4o不仅能力更强,速度更快,而且API价格也仅为前者的一半。

  1. 桌面版APP发布

发布会还宣布了桌面版 ChatGPT APP 的发布,这一版本旨在使用户界面更加简单自然,提升用户体验。

大模型友商:残酷打击

我觉得在这场发布会之后,最崩溃的就是OpenAI的竞争对手了——尤其是国外的大模型厂商。当大家还在不计成本的苦苦研究如何真正追上GPT-4的体验的时候,竞争对手竟然直接将这个模型免费开放给用户使用了。

这对友商来说,可以说是一个非常残酷的打击。

尽管OpenAI当下最为强有力的竞争对手Anthropic发布的Claude 3 Opus已经在体验上超越了GPT-4,并且其在用户端积累了一定的共识,但Claude 3 Opus的价格相比GPT-4非常昂贵,且不稳定,经常出现无法连接的情况。

如果GPT-4o真的效果显著反超了Claude 3 Opus而且还免费,那么可以说Anthropic弯道超车的可能性就更加渺茫了。

具身智能爆发前夜?

不要小看了这次的语音交互能力的升级。要知道,如今各大厂的语音交互的体验,都与真人的语音交互差的非常远。

比如有的需要用固定的唤醒词,有的语音识别非常不准,而且普遍语义理解能力非常有限,更为重要的是,如今的语音产品普遍不具备类人的对话打断和情感能力,这使得真实使用的时候非常恼人——你明知他在胡说八道了,骂它一顿结果它还听不懂,甚至它还在那儿自说自话停不下来。

而GPT-4o的发布,使得这个糟糕的体验有望出现大幅转折——人工智障时代可能要结束了。如果体验真如发布会所称的这么好,那么毫无疑问,这对于智能硬件行业是一个不小的变量。

具身智能也从此有了更和谐的交互能力,人与AI的距离被极大的拉近了。

AI应用生态的爆发催化剂

值得注意的是,GPT-4系列的API价格正在以远超摩尔定律的速度疯狂降价,这意味着先进AI的访问成本将快速的、无限的接近0。

由此,未来开发者将有能力支撑起巨大C端访问量的复杂AI原生应用,而不会像如今一样,为了覆盖成本,只能收费使用。而一旦收费,这个应用的门槛将极大的提升,网络效应难以成立,破圈的可能性将极大的降低。

GPT-4o不仅玩法上给AI原生应用提供了更多可能性,访问成本的大幅降低,可能会进一步催生AI应用生态的爆发。

2024下半年,将是一个非常令人期待的时代。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI王炸更新GPT-4o,干掉所有语音助手!丝滑如真人引爆全网科幻成真!蚂蚁百灵大模型一号位:GPT-4o发布不意外,原生多模态方向已明无可奈何花落去:“友情”在消亡?马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文【行业日报】 OpenAI推出新人工智能模型GPT-4o!沃尔玛计划裁减数百名公司员工!GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传未央播报 | 央行进一步推动优化支付服务工作 OpenAI发布多模态大模型GPT-4oGPT-4o发布!AI实时视频通话丝滑如人类,Plus功能免费使用OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了OpenAI掌门人最新专访:GPT-4o让我爱不释手 下代大模型可能不叫GPT-5我们的那些故事(剧终)华为余承东称传统车企流量根本干不过小米/阿里打骨折,百度免费,大模型掀降价潮/微软发布 50+ 重磅更新OpenAI深夜炸场,GPT-4o干翻所有语音助手!麦当劳回应使用过期食材:深表歉意;璩静离职后发声丨邦早报GPT-4o发布,产品经理如何应对即将到来的“钢铁侠贾维斯助理”时代?OpenAI再压谷歌一头,最强模型GPT-4o免费发布,语言对话媲美人类反应全能模型GPT-4o惊艳发布!AI可提供情绪价值,还结婚么?OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代GPTOpenAI发布全新模型GPT-4o;淘宝改版首页:频道入口由三栏变双栏呈现……春天的魅力惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发Mac 版 GPT-4o 语音交互现场演示来了,与 \bSora 梦幻联动,新模型更多细节曝光微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应OpenAI 用 26 分钟改变世界!免费版 GPT-4 来了,视频语音交互快进到科幻片昇腾社区回应网传华为发布会大模型生成图片系人工操控;Sam Altman:新款语音模型GPT-4o尚未发货丨AIGC日报OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型微软昨夜AI全家桶狂飙:GPT-4o上云,纳德拉现场表白OpenAI,Altman剧透新模型拾起久远的记忆:学习女红(gong)OpenAI发布新旗舰模型GPT-4o;字节跳动正式发布豆包大模型|AIGC周观察第四十三期我为何不喜欢网络辩论:深入探讨虚拟争吵的背后绝地反击!超5000只个股上涨,微盘股指数狂飙8%!热门赛道再度起飞,20%涨停一大片...OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真OpenAI发布全新模型GPT-4o;麦当劳回应使用过期食材;王化回应小米 SU7 刹车故障;璩静离职后发声...
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。