Redian新闻
>
免费!免费!免费!GPT-4o是什么?是你想要的一切

免费!免费!免费!GPT-4o是什么?是你想要的一切

公众号新闻

距离GPT-4的发布已经过去了一年,当地时间5月13日上午10点,OpenAI春季发布会千呼万唤始出来。


这次发布的既不是传了很久的搜索引擎,也不是GPT5,而是GPT-4的迭代版本,GPT-4o。在未来几周内,用户将会陆续自动更新到GPT-4o。


GPT-4o作为新一代旗舰模型,把AI工具的使用门槛降到了更低的程度,不仅比上一代速度快两倍,能实现无延迟实时对话,而且用户不用注册功能全部免费


此外,ChatGPT现在有桌面版本了,轻量化的使用体验可以无缝融入你的任何工作流程,再也不用苦哈哈地往网页上搬砖了。据OpenAI的CTO米拉·穆拉蒂(Mira Murati)表示,这也是他们第一次在易用性上做出改进。


“O”是包罗万象的O


发布会刚开始,米拉·穆拉蒂为这次新发布定了调,说OpenAI的目标是进一步减小人们使用AI的障碍,让所有人都能在工作、学习、创造中用上AI工具。


为了这个目的,OpenAI做了三件事:发布更强大的模型GPT-4o,更新用户界面提高使用体验,然后一口气免费开放给用户。穆拉蒂补充道,付费用户享有五倍的使用容量限制。


米拉·穆拉蒂主持了整场发布会,萨姆·奥尔特曼没有露面|@OpenAI


据OpenAI表示,GPT-4o是一个“原生多模态”模型,它的命名来源于“omni”,即包罗万象之意。


比起此前要么是图文模式要么是语音模式的GPT-4,它更擅长打组合拳,可以接受文字、音频、图像的任意组合输入,然后无缝衔接图文音频的多种形式输出。


升级后的GPT-4o回答速度更快了


据OpenAI表示,GPT-4想要实现和人的对话需要通过三步来实现:先把语音转换为文字,再生成回复文本,最后再转成语音。根据用户选择模型的不同,这个过程的平均延迟高达2.8秒 (GPT-3.5)和5.4 秒(GPT-4),对着手机屏幕等回复,跟GPT聊过天的朋友应该都有类似的体验。而且在语音转文字再转语音的过程中,很多信息损失了,GPT无法获得说话人的音调,也无法收取背景音,如果有多个人一起说话更是灾难性的场景。


“我们跨文本、视觉和音频端到端地训练了一个新模型,”OpenAI写道,“这意味着所有输入和输出都由同一神经网络处理。”现在的GPT-4o可以在最短232毫秒内响应对话,平均响应时间320毫秒,和人类的反应速度几乎一样,爱跟ChatGPT聊天的朋友终于可以从微信语音模式切换到日常交流模式了。


GPT-4o还带来了更好用的界面


再也不用在网页间互相切换了,新的桌面版GPT可以融入任何工作流,随时和用户用图像文字语音进行交流,虽然还没用上,但可以想像这种工作体验有多快乐。


右上角是桌面版GPT的小窗口,可以贴代码让它debug,可以截图让它读表格,也可以随时跟它对话|@OpenAI

 

此外,萨姆·奥尔特曼在X上补充道,模型升级不止在GPT上,开发者也可以在API里同步使用GPT-4o,价格是GPT-4 Turbo的一半,速度是GPT-4 Turbo的两倍。GPT-4o还在50多种除英文外的语言能力上得到了加强。


连呼吸都能辨别


发布会的最后一个环节是实机演示。OpenAI麾下的大牛研究员Marc Chen和Barret Zoph一起展示了新模型的强大之处。


在第一段对话里,Chen对GPT说,自己有点紧张,然后开始急促地呼吸。GPT识别到了他呼吸的声音,说,别紧张,你喘得像个吸尘器,深呼吸,再吐气。接着GPT开始指导Chen怎么深吸慢呼平复心情。



这个demo设置得很妙,它展示出了两个重要的新能力:听环境音和即时反馈


GPT不再需要一轮一轮地进行对话,它可以同时听人喘气和进行呼吸指导,输入和输出在同时发生。


第二个demo里,Chen让GPT给Zoph讲个睡前故事哄他入睡,Chen反复打断GPT的讲述,问它能不能讲得更刺激点,最后,GPT跟迪士尼公主似的把故事用歌唱了出来。


有时候GPT给人感觉话太多了,在新版本里,你要是不想听可以立刻打断或者提出意见,就像在真实生活里的交流一样。


后面的几个demo里,GPT教Zoph做了数学题(“你能不直接告诉我答案,而是启发我一步一步解完嘛?”),给大家解释了代码,读了图表,给Zoph看了面相(“你很开心,又有点激动。”),最后还当了Chen和穆拉蒂之间的同声传译。


GPT给Zoph看面相|OpenAI


我个人的体会是,这个版本的GPT比以前更像人了,对话中会开更多的玩笑,语气词也多了不少,这和OpenAI所说的提高GPT的工具性似乎有点相悖。我可能会在用的过程中让它少废话,否则真的会有点情感压力。


但还是有很多人对这次发布会不满意。有网友觉得OpenAI在挤牙膏,一年多过去了仍然在GPT-4上裹足不前,也有人对免费提出了质疑。


“当服务免费时,用户就是产品。”“(ChatGPT免费之后)OpenAI获得的数据量会超出想象。”



对一般用户来说,不用注册即可使用已经是个天大的惊喜了,再也不用找国外手机号了,懂的都懂。


作者:翻翻

编辑:Odette

封面图来源:OpenAI


本文来自果壳,未经授权不得转载.

如有需要请联系[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步《生命和家园 10》苹果WWDC最新解读!GPT-4o加入!Siri大变样!苹果一夜重塑iPhone!GPT-4o最强助力!库克:开启苹果AI新时代!OpenAI掌门人最新专访:GPT-4o让我爱不释手 下代大模型可能不叫GPT-5GPT-4o“炸裂登场”,响应速度堪比真人,关键还免费!网友评论褒贬不一,有人称苹果Siri现在“满头大汗”《阴阳鱼》连载第43章:时间如刀,空间如砧板,而你我都不过是鱼肉微软加速AI生产力革命!GPT-4o 重塑 Windows,奥特曼“意外闪现”爆料下一个重要模型Sam Altman点赞!GPT-4o的幕后AI大佬是...OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5我和老伴(十)深夜重磅!GPT-4o 正式发布:视频语音交互丝滑到吓人,还免费可用GPT交卷!GPT-4o 大战国产 AI 模型写 2024 高考作文,今年谁能交出「满分作文」桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”“她”来了!GPT-4o让AI陪伴创业公司无路可走?微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了“GPT-5”发布时间曝光!GPT-3是幼儿,GPT-4像高中生,新一代大模型将达博士水平谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索!这就是你想要的公众号微软发布新AI PC全家桶,支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」,本人回应山中寺庙GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云[干货] OpenAI 最新产品GPT-4o,“o”代表什么?OpenAI一夜干翻语音助手!GPT-4o模型强到恐怖,ChatGPT学会看屏幕,现实版Her来了重磅!中国大模型头名易主!GPT-4o和Yi-Large并列第一!谷歌2小时疯狂复仇,终极杀器硬刚GPT-4o!Gemini颠覆搜索,视频AI震破Sora原来我写了那么多字啊Apple WWDC24的18条总结:从GPT-4o开始集成ChatGPTChatGPT-4o,人类「AI 助理」的一大步|Z TalkChatGPT 大更新曝光!免费用户自动升级 GPT-4 ,还能创建 GPTs刚刚,微软掀起生产力革命!GPT-4o 重塑 Windows,奥特曼登场剧透新模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。