Redian新闻
>
ChatGPT终于活成了iPhone最想要的样子

ChatGPT终于活成了iPhone最想要的样子

公众号新闻

OpenAI 的盲盒终于被开了,深夜追直播什么的,咱这种老人是做不到了。

等到第二天看了一圈国内的报道,剔除掉「改写历史、颠覆世界、震惊全场」的描述。

从标题上,其实很简单就能看出这次 OpenAI 在发布会上到底干了什么。

视频语音交互丝滑到吓人

干翻所有语音助手

实时语音视频交互震撼全场

......

以及 90% 标题里会点到的一个词:「免费」。

是的,如果你还不了解发布会的内容,咱们一句话就能总结——

在 OpenAI 的春季发布会,上新了一款主打交互的旗舰新模型 GPT-4o,不是 omg 的 o,是 omni(全面、全能)的 o,而且最关键的是,对所有用户免费开放。

是的,你现在访问这个链接。

https://chatgpt.com/?model=gpt-4o

只要能登上账号,无论有没有给 OpenAI 交钱,都能看到一个弹窗。

点个立即试用,随便聊上一句,回答你的就是 GPT-4o。

如果暂时抛开 GPT-4o 的强度和新特性不谈,就冲这个新模型人人免费的事,我要是第二天开发布会的谷歌,那多少得失眠。

浓眉大眼的奥特曼,怎么又来怼脸狙击?

不对,总是在推特上给自家 GPT 带货的奥特曼,在直播里压根就没现身。

颇有一种,「是谁发布的不重要,发布了什么更重要」的绝对自信。

那 GPT-4o 有多强?

OpenAI 早两天偷偷把官网上 GPT-4 曾经那不可一世的「最先进」,改成了「先进」。

从各种冷冰冰的测试数据看,GPT-4o 文本、代码这样的基础能力保持了和前代差不多的水准。

但报道里反复提及的多模态交互,GPT-4o 是吊打友商的存在。

多模态这个概念,早早就被提出来了,说人话就是让大模型不光在认字这一个维度,还可以根据语音、图片、视频完成交互。

那如何让大模型听得懂,也看得懂?过去的方案,听起来像搭积木。

咱们就以相对简单的语音交互为例,三步走——

1、语音转文本;

2、文本传入大模型,生成新文本;

3、新文本转语音。

这样的实现思路很透明,至少前面多模态被提出的时候,开源社区很快就以插件的形式 DIY 实现「平替」了。

国内外拿出来给你用的成品大模型,在多模态这里的技术路线大差不差,甚至说我觉得在用户体验上,国内很多模型比 ChatGPT 还要强。

但这么搭积木的代价呢?

按 OpenAI 这次揭秘的数据来说,多模块之间的交互,会带来感知明显的延迟,GPT-3.5(2.8 秒),GPT-4(5.4 秒)。

而且在完成整个任务的过程中,大模型感受不到更多的外界信息(音调、语气、背景噪音等)。

GPT-4o 不一样,不是「伪多模态」,正儿八经的、端到端的原生多模态。

是的,一个模型就把任务流程给跑通了。

这么做的好处,就是前面提到的延迟,被大幅降低,平均为 320 毫秒就能回应你说的话。

你的情绪、语气、背景音、背景环境 GPT-4o 都内给你正确反馈。

一个跨文本、音频、视频,进行实时推理的 AI,你说改写世界、颠覆历史太夸张了。

但只说炸不炸?很炸。

说实话,强烈建议大家去 B 站上看一眼发布会。

一开始看报道,什么 GPT-4o 充当实时翻译助手,什么 GPT-4o 感受情绪、识别场景、随时打断,打开摄像头就能实时陪伴。

给我的感受是——

就这?就这?就这?

看了发布会的视频,知道它是一个模型搞定的,感受就变成了——

卧槽!卧槽!卧槽!

不夸张的说,用最少的操作,最丝滑的实时交互,发布会没有新想法,却带来了更多对未来的想象,OpenAI 确实领先。

而且 GPT-4o 免费了,不光新模型免费,以前 Plus会员独享的各种能力,包括视觉、联网、记忆、GPT Store 等等。

一口气全都打包放出。

如果你有 ChatGPT 的账号,不妨试试看,全量免费的 GPT-4o,像联网啥的已经适配了。

PS:生成速度贼快,比之前 GPT-3.5 都要快。

前两天看报道,说是国内大模型是两条腿走路:一条腿开源,去做生态;一条腿闭源,去搞商业。

OpenAI 这次彻底不 Open 了,新模型发布,非但没有论文,连个技术报告也没给,但打出了免费这张牌。

你可以说它格局大,但不能忽视免费后,吸引过来的海量对话数据,这才是 OpenAI 能领跑的前提。

说真的,也就是国内访问不了,要不然不知道多少收费友商,要开始挠头了。

我本来想测一测音视频交互的,但去查了一下 OpenAI 官X,目前还没开放使用,连灰度都没有。

至于为啥延期几周才能体验?看了眼几周后,有个号称史上最大更新的苹果发布会。

再联想到之前苹果要和 OpenAI 合作,答案呼之欲出——

ChatGPT 终于活成了 Siri 最想成为的样子。

科幻终于照进了现实。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了熵泱——第四十四章How DAN, ChatGPT’s Rogue Twin, Is Wooing Young Chinese52岁朱茵现状:住深山村屋开两万块破车,网友:活成了大妈的样子?小米 SU7 Pro 已提前开始交付/iPhone 17 Slim 定价或高于 Pro Max/ChatGPT支持分析Excel人流创10年纪录!墨尔本City,终于活过来了!火过迪士尼,年轻人的“穷鬼乐园”,网友:动物们终于“癫”成了我看不懂的样子!官方回应五月天假唱风波;保时捷召回1590辆电动车;苹果OpenAI达成协议,将ChatGPT应用于iPhone丨邦早报ChatGPT登录iPhone!Siri引入“最强大脑”,能看图能识字,iOS 18必升!苹果或将 Gemini 整合到 iPhone ,6 月或将揭晓 AI iPhone春天到了不说脱口秀的李诞,终于活成了网红ChatGPT实体化了!手机变身ChatGPT实体机器人,只需一个配件,能说话还会做梦,真的牛!露营终于癫成了我喜欢的样子GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成用了25年时间,痴迷西部牛仔的爷爷把自家打造成了好莱坞电影中的样子!ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5巴菲特:iPhone 可能是史上最伟大的产品/iPhone 16 新机模曝光/马斯克:部分 Model Y 可付费解锁更多里程消息称 iPhone 即将引入 ChatGPT/理想回应 L9 汽车误将广告识别成真车致追尾/官方公布五月天假唱调查结果ChatGPT 大更新曝光!免费用户自动升级 GPT-4 ,还能创建 GPTs苹果计划大改 Siri 赶超 ChatGPT 等竞品/OpenAI CEO称iPhone是最伟大的技术产品/星舰将进行第四次飞行加拿大终于活成印度的样子! 大群印度人上铁轨逛大街 以为来错国家$99 入 iPhone 12 和 iPhone 12 Pro【手慢无】法国南部特鲁斯10秒整理搜索结果,脑图表格一键生成,网友:搜索终于有了该有的样子突发 | ChatGPT 即将登陆 iPhone!苹果接近与 OpenAI 达成协议突发 | ChatGPT 即将登陆 iPhone!苹果接近与 OpenAI 达成协议,我们挖出了这些新功能细节美股基本面 - 2024_03_16 * 晨报 * 日本加息?巨头不怕!。中欧专家共议欧盟2040气候目标,实行CBAM还应考CG跟练有感两件大事,创造历史!我们终究活成了自己最讨厌的样子iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?造化弄人:每个人都会活成自己最讨厌的样子8点1氪:贾跃亭点评小米汽车:值得点赞;iPhone SE 4手机壳被曝将采用刘海屏设计;ChatGPT无需注册可直接使用SU终于活过来了?苹果考虑将 Gemini 整合到 iPhone 中,6 月或将揭晓 AI iPhone
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。