Redian新闻
>
GPT-4.5/5 内测版回归?OpenAI 神秘新模型惊艳网友,另一个重磅更新即将上线

GPT-4.5/5 内测版回归?OpenAI 神秘新模型惊艳网友,另一个重磅更新即将上线

公众号新闻

前段时间,一个名为 gpt2-chatbot 的神秘大模型一夜冒头,凭借媲美 GPT-4 的实力在整个 AI 圈赚足了眼球,甚至被认为是 GPT-4.5/5 的内测版。
连 OpenAI CEO Sam Altman 都忍不住下场蹭起了热度:
我确实对 gpt 2 情有独钟。
好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:

Im-a-good-gpt2-chatbot

Im-also-a-good-gpt2-chatbot
GPT-4.5/5 的内测版?到底什么来头
新模型的诞生总能激起网友的狂欢,短短几天,网友已经将这两款模型玩出了花。
网友 @kiieford 给 im-a-good-gpt2-chatbot 出了个难题,让它创建一个对 mp3 文件做出反应的 3D 可视化网页,结果一次就成功了。
当网友让它分析一张直升机的符号照片时,Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解细节,「看图说话」的能力堪称一流。
在同一问题的对比上,这两位「选手」的表现可谓是各有千秋。
im-a-good-gpt2-chatbot 不仅对于给出了详尽的解答,更是将游戏的机制和得分情况分析得头头是道。而 im-also-a-good-gpt2-chatbot 的回复简洁凝练,直击要点,虽然话不多,但每一句都是精华。
别看 im-also-a-good-gpt2-chatbot 在回答问题时惜字如金,做起事来却一点也不含糊。
当网友输入提示词:Code Flappy Bird game in Python,让其编写鸟飞类游戏代码时,配上几张精心挑选的 Png 照片,不一会儿,一个生动的游戏界面便大功告成。
当 AI 遇上中文问题,这两个模型的表现瞬间拉开差距。
im-a-good-gpt2-chatbot 的回复展现了它对中文语境的深刻理解,面对「鲁迅打周树人」这样的调侃,它能指出其中的幽默之处。
而 im-also-a-good-gpt2-chatbot 则洋洋洒洒写了一大堆,强行上价值的回答仿佛在做阅读理解。
不过 im-also-a-good-gpt2-chatbot 在编程方面的表现也确实可圈可点。
网友 @itsandrewgao 要求其编写一个方格颜色随机变化的康威生命游戏代码,并且要显示每一代的活细胞数量时,虽说最初的结果不太理想,但在网友的再次要求下,它能够自行修复代码。
Reddit 网友抛出了一个棘手的物理问题,此前连 GPT-4 Turbo 也没能成功解答,而 im-also-a-good-gpt2-chabot 却给出了正确答案。
总想挖点猛料的网友向 im-a-good-gpt2-chatbot 发起了灵魂拷问,询问其是否为 GPT-4.5 时,其回复道:「我是一个基于 GPT-4 架构的优秀聊天机器人,特别是 GPT-4.5 变体。我所接受的训练数据包含直至 2023 年 11 月的信息。」
坏消息是 Altman 此前在哈佛大学演讲时曾明确否认 gpt2-chatbot 为 GPT-4.5/5,但好消息是,这也意味着 GPT-4.5/5 的性能或许将远超我们的想象。
包括 OpenAI 首席运营官 Brad Lightcap 最近也放出豪言,当今的生成式 AI 在一年内就会变得「糟糕得可笑」,言语之间对即将到来的 GPT-4.5/5 充满了自信。
即便这两款模型并非是 GPT-4.5/5,但或许也与 OpenAI 也脱离不了关系。
无论是几天前,Altman 疑似发帖「剧透」:Im-also-a-good-gpt2-chatbot,还是网友 @nanulled 的最新发现,似乎都让这些模型出自 OpenAI 之手的猜测再添实锤。
附上这两款模型的体验方法:

访问 http://chat.lmsys.org 并选择「Arena (battle)」

输入提示词并对响应进行评分,检查聊天框底部的评分模型

重复上面步骤,直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」
OpenAI 最近的大更新,是 AI 搜索
比起捉摸不透的两款新模型,OpenAI 即将发布的 AI 搜索引擎其实更值得期待,这或许也会给晚些时候亮相的 GPT-4.5/5 作铺垫。
最近,据可靠爆料人@apples_jimmy 透露,OpenAI 将于北京时间 5 月 10 日发布 AI 搜索引擎。不过 The Information 提醒,OpenAI 内部也还没完全确定发布日期,随时都有「跳票」的可能。
彭博社则爆料了这款即将发布的产品的一些使用情况。用户只需通过自然语言的方式提问,它就会翻遍维基百科条目和博客文章,给用户一个满意的答案。
它还支持用书面文字和图像来回答问题。比如你问它该如何更换门把手,不仅会有文字耐心告诉你一步步怎么做,还可能附上一个清晰的图表手把手教你。
目前访问 OpenAI 官网网址 https://openai.com/,首先出现的便是官网的轮转页面「Ask ChatGPT Anything」,输入问题后,即可跳转至 ChatGPT 获知答案。
昨天国内也有博主 @赛博禅心已经抢先体验了一波功能。
例如,在搜索 5 月 7 日苹果发布会的内容时,ChatGPT 引用了 4 个高质量的网址信源,答案总结得井井有条。
但在搜比特币的价格时,它的回复不够实时,并且在其他问题上,中英文的回复也有点混淆。搜索服务的内核还是 Bing,但响应速度比以前快了不少。
向左滑动查看更多内容,图片来自@赛博禅心
前阿里顶级 AI 科学家贾扬清则对 ChatGPT 的搜索功能赞不绝口。
在同样体验新功能后,他认为这项技术正在取代那些仅通过调用传统搜索并利用大型语言模型(LLM)来总结结果的简单工具。
他举例称,通过询问「今天 Hacker news 最受欢迎的帖子说了什么」这样的问题时,就能看出 ChatGPT 新搜索功能的独到之处。
Google 会甩给你一堆链接,让你自己慢慢翻;Copilot 努力了,但结果有些跑偏;Gemini 会礼貌地教你一步步访问网址;Perplexity 给不出足够的信息量,而 ChatGPT 呢,不仅真正访问了实际网址,还直接让答案触手可及。
向左滑动查看更多内容
传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。在这个信息爆炸的时代,我们对搜索的期待早已超越了简单的「搜索」二字。
从 Perplexity 自称的「世界上首个答案引擎」就可以看出,AI 时代下的我们,需要的只是一步即达的答案,而不是略显繁琐的「搜索」。
这是诸如 Perplexity 等工具得以在极短的时间内声名鹊起,甚至叫板 Google 的底气所在,同样也是 ChatGPT 碾压实力备受贾扬清青睐的原因所在。
实际上,没有人比 OpenAI 更懂怎么狙击竞争对手了,这次也不例外,瞄准的或许依然还是那个熟悉的「倒霉蛋」—— Google 。
今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,这一炸裂性的头条新闻溅起的水花,不到几个小时就被 OpenAI 的 Sora 狠狠压下。
而最近彭博社报道称,OpenAI 目前正在组建新的搜索团队,平时也没少往 Google 家里「撬墙角」。
与此同时,OpenAI 即将推出的 AI 搜索引擎也选了个好时机,有意无意地与下周二即将召开的 Google I/O 大会撞了个满怀,也让这场发布会尚未开始就平添了几分火药味。
不过,OpenAI 的这些小动作似乎并未给 Google CEO 皮查伊造成太多压力。
昨天在接受彭博社的采访时,他还淡定回应「我们不是第一家进行搜索、第一家提供电子邮件的公司,我们也不是第一家开发浏览器的公司。」
言外之意就是,别急,好戏还在后头。
每个人面临的挑战和机遇是:在一个存在大量合成内容的世界中,你如何了解什么是客观和真实的?我认为这将定义未来十年搜索的一部分。
当然,就像一夜横空出世的 Sora 将 Runway、Pika 打得毫无招架之力,当 OpenAI 与 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被这场风暴「殃及池鱼」。
而距离这个谜底的揭晓,或许已经不到 24 个小时了。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
OpenAI 宣布终止对中国、朝鲜、俄罗斯等地区提供 API 服务,大家怎么看?微信上线「分期」付款功能;搭载 ChatGPT-4o 的智能眼镜出现;「被美女包围了」手机版将上线 | 极客早知道神秘大模型一夜“征服”所有人,超GPT-4却无人认领?网友:OpenAI 要有大麻烦了ChatGPT 语音模式酷似「寡姐」?OpenAI 刚刚发文回应OpenAI releases real神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传用GPT-4纠错GPT-4!OpenAI推出CriticGPT模型;谷歌Gemma 2发布,与第一代相比性能更高丨AIGC日报OpenAI CEO最新演讲:GPT-5性能远超GPT-4;媲美Sora,视频生成模型EMO上线通义APP丨AIGC日报OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!特朗普侄子即将出版回忆录,揭露家族内部的“阴暗角落”天壤之别GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5美国旧金山,城市岸景华为余承东称传统车企流量根本干不过小米/阿里打骨折,百度免费,大模型掀降价潮/微软发布 50+ 重磅更新OpenAI首席科学家宣布离职,曾参与驱逐CEO奥特曼;马斯克称OpenAI最新模型“慢得离谱”丨AIGC日报OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语苹果发布Apple Intelligence,官宣免费接入ChatGPT,Siri迎来重磅更新微软昨夜AI全家桶狂飙:GPT-4o上云,纳德拉现场表白OpenAI,Altman剧透新模型14、长篇家庭伦理小说《嫁接 下》第四章 重拾自信(2)OpenAI发布全新模型GPT-4o;淘宝改版首页:频道入口由三栏变双栏呈现……OpenAI发布全新模型GPT-4o;麦当劳回应使用过期食材;王化回应小米 SU7 刹车故障;璩静离职后发声...发布屡次截胡?OpenAI与谷歌携新版大模型再度交锋 | 大模型一周大事OpenAI推迟发布ChatGPT语音模式,但MAC端桌面版ChatGPT上线了挺突然呀,OpenAI CEO奥特曼和他的丈夫承诺捐出大部分财富长篇小说连载《此世,此生》第五十九章二别等 Sora 了!Runway 深夜发布 Gen-3 模型,演示惊艳网友,AI 视频卷出新高度神秘模型gpt2-chatbot实力被赞超越GPT-4:sam亲自确认,或是OpenAI全新模型苹果或在今晚发布 Apple Pencil Pro/雷军:逛完北京车展后「很绝望」/微软或开发新模型与 OpenAI 竞争※ ※ 模范情书 ※ ※ 春天快乐!!!AI早知道|小红书内测自研大模型“小地瓜”;OpenAI为ChatGPT Plus用户开放“记忆”功能微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了OpenAI爆炸更新:GPT-4免费了!新模型GPT-4o发布,视觉、语音能力大幅增强,速度起飞,API打骨折GPT两重惊喜!奥特曼预告GPT-4和ChatGPT重大更新,Open AI要放大招每天都看模型评分,但你真的了解吗?OpenAI研究员最新博客,一文读懂LLM评估今天起,这个重磅功能向 ChatGPT Plus 用户全面开放!GPT-4.5 疑似泄露, Altman 在线「吃瓜」这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单微软深夜发布 50+ 重磅更新!Copilot 重新定义生产力,ChatGPT 之父压轴登场
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。