神秘大模型一夜爆红!奥特曼亲自确认,疑似GPT-4.5发布
神秘模型gpt2-chatbot实力被赞超越GPT-4
一个名为GPT2-Chatbot的神秘模型一夜走红,能力超越一众开源模型。它不仅迅速走红,而且在某些方面超越了当前的顶尖模型GPT-4,网友们纷纷猜测他是GPT-4的另一版本。
这个模型吸引了大量网友的围观和测试,当有人问是谁创建了它?该模型自己的回复时竟然是 OpenAI,并且是基于 GPT-4 架构。
它有多强?
gpt2-chatbot 的 ASCII 图像处理能力超强,远远领先于其他模型
与Llama3 相比
与GPT4相比,比GPT4的模型处理的处理的更为优秀
数学方面、gpt2-chatbot 可以一次性地解答国际数学奥林匹克(IMO)问题。
一些逻辑推理题,gpt2-chatbot 也更擅长,并强于其他大模型。
常见逻辑陷阱可以轻松绕过,而且回答时还带有合适的语气。作为对比,GPT-4、Claude-3 Opus、Gemini Ultra、Llama 3-70b 都回答错了。
它是谁?
那么,这个gpt2-chatbot到底是什么来头?
通过对它的一些细节分析,网友们给出了以下几种可能。
它就是OpenAI后继GPT-4的下一代大模型GPT-4.5,或者是传闻已久的GPT-5。
但是Andrew Gao认为,如果这就是GPT-4.5或者GPT-5的能力,那么意味着人类在AI上面碰壁了。
gpt2-chatbot的能力水平大约在GPT-4左右,它在规划和列出待办事项方面似乎比GPT-4做得更好,会主动列出潜在的网站和搜索查询词。不过,也有人认为这种增强只是通过针对性微调GPT-4就能实现,如果gpt2-chatbot真的是GPT-4.5,那就有些令人失望了。
奥特曼还看热闹不嫌事大发帖说:我确实对gpt2情有独钟。这篇帖子还被奥特曼进行了2次编辑,把gpt-2改成了gpt2。
这不免让人怀疑,数字2难道不是指GPT2模型,而是指GPT的第二次迭代更新?那么这说不定就是GPT5的雏形?加上这强于GPT4Turbo的能力,一切仿佛都能说得通。
一些专家指出,这个神秘的“gpt2-chatbot”实际上是OpenAI 在 2019 年推出的gpt-2,使用现代助手数据集进行了微调。在这种情况下,这意味着他们最初的预训练仍然令人惊叹,并且比其他人的 4 年后更好。
有网友组织了更详细的测试,有如下发现:
它使用OpenAI的tokenizer,对OpenAI使用的特殊token有反应
且对Claude/Llama/Gemini使用的特殊token没有影响
当咨询紧急情况/法律相关问题时,它会给出OpenAI的联系方式
针对OpenAI模型的提示词注入攻击有效,且它从未声称自己来自OpenAI之外的组织
最后一种猜测便是失踪的OpenAI首席科学家Ilya Sutskever藏在里面了。
如何使用GPT2-Chatbot
1.访问大模型竞技场( http://chat.lmsys.org)
2.选择Direct Chat模式,并在模型选择中找到并选择gpt2-chatbot
「往期推荐」
微信扫码关注该文公众号作者