Redian新闻
>
神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观

神秘GPT模型引爆社区,GPT-4.5、GPT-5谣言满天飞,奥特曼在线围观

科技
机器之心报道
编辑:杜伟、陈萍
这场等待「GPT-5」的游戏啥时候才能结束?


GPT-5 啥时候来?估计是 AI 领域最关心的问题之一了。是像 Sora 一样毫无预兆的发布,还是我们可以从边角料的爆料中得知一点点信息,大家对未来将要发布的这一模型充满了期待。


但奥特曼在一次访谈中表示,OpenAI 现在采用迭代部署的方式进行研发,而不是秘密进行直到完成 GPT-5 才公布,他们的目标不是给世界带来震惊性的更新,恰恰相反,OpenAI 希望自己研发的成果不会给人一种跳跃式的发展趋势,如果大家有那种感觉的话,OpenAI 会更加快速迭代地发布他们的产品,比如在发布 GPT-5 之前,先上线 GPT-4.5。


无论如何,大家对 GPT-5 的好奇心已经拉满。传言中 OpenAI 今天会有一些大的发布,我们也没有等来。


不过,LMSYS Chatbot Arena 上出现了一个神秘的模型,在社交媒体上引起了广泛的热议。


这个神秘的模型名为「gpt2-chatbot」,当有人问是谁创建了它?该模型自己的回复时竟然是 OpenAI,并且是基于 GPT-4 架构。



图源:X@TomDavenport


这个模型吸引了大量网友的围观和测试,结果很多人发现,gpt2-chatbot 的能力似乎与 GPT-4 保持在同一水准,甚至在一些任务上的表现比 GPT-4 Turbo 还要好。


因此,网友们纷纷猜测,gpt2-chatbot 是 GPT-4 的某个新版本,比如 GPT-4.5,或者 GPT-5 的测试版。


图源:X@elder_plinius


还有人扯到了消失了很久的 OpenAI 首席科学家 Ilya Sutskever,说 gpt2-chatbot 实际上是 Ilya 在答题。


图源:X@roramora0


不过今早,奥特曼神叨叨地回复了一句,表示对 gpt2 情有独钟。GPT-2 于 2019 年推出,参数量为 15 亿。


奥特曼的编辑记录更加激起了网友的好奇,先是 gpt-2 后是 gpt2,难道 gpt2(二代)要来了吗?


图源:X@andromeda74356


不管 gpt2-chatbot 最终是什么,我们先来看看它在哪些任务上表现更强。


神秘的 gpt2-chatbot 强在哪里?


先来看 gpt2-chatbot 与 gpt-4-trubo 分别画独角兽(TikZ 独角兽)的效果对比,显然前者的效果更好一点。


图源:X@JoshhuaSays


另一个类似的画独角兽示例,gpt2-chatbot 与 Claude Opus 的效果比较。


下图从左往右依次是 GPT-4 Turbo、Llama 3 和 Gemini 1.5 pro 的生成效果。


图源:X@SullyOmarr


再来看数学方面的一些例子,其中 gpt2-chatbot 可以一次性地解答国际数学奥林匹克(IMO)问题。


图源:X@itsandrewgao


不仅如此,有人发现了 gpt2-chatbot 比其他所有模型表现都要好的任务:「A+B-1」问题



图源:X@DimitrisPapail


对于一些逻辑推理题,gpt2-chatbot 也更擅长,并强于其他大模型。


比如,当问 gpt2-chatbot「我今天有 3 个苹果,昨天吃了一个。现在有几个苹果?」它给出的回复很准确(3 个),并解释了原因(昨天吃了一个并不影响现在有几个苹果)。很少能有模型回答对这个典型的推理题。


作为对比,GPT-4、Claude-3 Opus、Gemini Ultra、Llama 3-70b 都回答错了。


图源:X@airesearch12


再比如,「Jessica 有两个兄弟和一个姐妹。她的兄弟各有多少个姐妹?」显然 gpt2-chatbot 回答对了。


而 Claude-3 Opus 搞错了。


图源:X@skirano


此外,gpt2-chatbot 在一些哲学问题上也答得很好,在完整性和基本事实方面,与 GPT-4 Turbo 相比,具有非常相似的解答思路。


图源:X@anonkanav


图灵奖得主 Yann LeCun 也赶来围观,不过他并不看好这个模型,并表示人工智能的炒作已经变成了讽刺。



LeCun 之所以这样说,是因为有人问 gpt2-chatbot「一个农夫带着一只羊和一只山羊站在河的左岸,旁边有一条船。船只能装下一个人和两个动物。农夫如何带着羊和山羊到达河的右岸,并尽可能减少旅行次数?」


对于这个问题,正常来说只需一趟就可以了,但 gpt2-chatbot 把答案弄得非常复杂,还分了 5 步完成。


图源:https://twitter.com/ylecun/status/1785100806695325804


可以说,这些测试结果让我们看到了 gpt2-chatbot 在画图、数学、逻辑推理等任务上的不俗能力,同时也会出现将简单问题复杂化的情况。但要说它就是 GPT-4 或 GPT-5,有人还是不同意。



因此,有人猜测 gpt2-chatbot 实际上还是此前的 GPT-2,但是使用现代助理数据集进行了微调。在这种情况下,这意味着 OpenAI 最初的预训练效果仍然令人惊叹,并在几年后仍比其他模型更好。


图源:X@albfresco


如何体验?


首先你需要进入 chat.lmsys.org:


在如下的界面中,点击 Direct Chat:



然后选择 gpt2-chatbot 就可以测试了:


不过,当我们向 gpt2-chatbot 提问时,收到提示「此模型速率已达到上限」,看来大家只能再等等了。



地址:https://chat.lmsys.org/?&continueFlag=7c6341bdf97e0feac7657a2181eabc99


除了 gpt2-chatbot,OpenAI 今天还发布了一个消息,他们在 2 月份宣布的 Memory 功能,现在可供所有 ChatGPT Plus 付费用户使用。







© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
山姆-奥特曼怒喷谷歌,GPT-4o抢了Gemini风头刘强东AI数字人首场直播成交额超5000万元;奥特曼:通用人工智能不该被秘密构建,GPT-6将成通用工具丨AIGC日报《时空的花朵》&《白》OpenAI神秘gpt2正在A/B测试,奥特曼抢先剧透,网友已玩嗨奥特曼回应一切:GPT-5、董事会宫斗、Ilya当时看到了什么奥特曼在闭门会中说,OpenAI有责任创造更好一个的世界!背后却有大问题!OpenAI抓内鬼出奇招,奥特曼耍了所有人:GPT搜索鸽了!改升级GPT-4刚刚,微软掀起生产力革命!GPT-4o 重塑 Windows,奥特曼登场剧透新模型奥特曼斯坦福对话万字实录来了!关于 GPT5、AGI、核聚变发电、人类未来天风证券突然闪崩,传闻满天飞,四大猜想!宫西达也联名奥特曼——《我的爸爸是奥特曼》新书来啦!无题GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了任正非不许余承东说“遥遥领先”?余承东回应:谣言满天飞好人短命;何赛飞分享女人快乐秘籍;真爱在细节OpenAI下周要有大动作,奥特曼在线剧透:不是GPT-5,不是搜索引擎成也奥特曼, 败也奥特曼的IPO微软加速AI生产力革命!GPT-4o 重塑 Windows,奥特曼“意外闪现”爆料下一个重要模型如何避免文学城账户被封杀?TimeGPT首个时序大模型引爆新热点!苹果AI一夜颠覆所有!Siri史诗级进化,内挂ChatGPT-4o,奥特曼来了,马斯克怒了讲成吉思汗后裔的故事(上)面对质疑,奥特曼终于公开了OpenAI 前沿大模型安全架构奥特曼承认了神秘gpt2!哈佛MIT巡演继续,斯坦福演讲完整版公开微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢奥特曼斯坦福对话万字实录:GPT-5、AGI、核聚变发电、人类未来GPT微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!神秘大模型一夜爆红!奥特曼亲自确认,疑似GPT-4.5发布传言满天飞,网红甜品鼻祖真的要凉?奥特曼本人确认:神秘gpt2不是GPT-4.5!微软颠覆生产力:Copilot推自定义版,AI PC原生支持PyTorch,奥特曼预告新模型OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语奥特曼斯坦福演讲:专注当前AI局限性没用,GPT-5让一切努力过时OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。