国际科技财经博客移民网络热点娱乐民生时事公众号

>

OpenAI神秘gpt2正在A/B测试，奥特曼抢先剧透，网友已玩嗨

OpenAI神秘gpt2正在A/B测试，奥特曼抢先剧透，网友已玩嗨

2024-05-08 05:05

明敏发自凹非寺
量子位 | 公众号 QbitAI

OpenAI正在秘密A/B测试下一代模型，实力超强被怀疑是GPT-4.5或GPT-5。

就在奥特曼当谜语人暗示之后，两款新模型悄悄上线大模型竞技场。

Im-a-good-gpt2-chatbot
Im-also-a-good-gpt2-chatbot

和GPT-4-Turbo（左）同场竞技，gpt2-chatbot（右）明显更胜一筹。

提示词：画一个自由女神像。

此前一款名为gpt2-chatbot的超强模型仅仅上线一天，热情的网友就把服务器挤爆了，不得不下架，大家纷纷表示还没玩过。

这次重新上线后，模型在一次报错中直接给出了跳转OpenAI平台网站的链接。

这下大家都嗨了，做实了是OpenAI在搞A/B测试？

还有人表示，这俩模型可能已经在推理和计划方面进行微调。

现在在竞技场里随机匹配，就能遇到这俩新模型。

这不，网友们已经纷纷前去测试，一探它们的底细了。

代码能力突出

和第一次露面有所不同，如今想要用上gpt2，只能在Arena(battle)里碰运气，Direct Chat中找不到它们的影子。

有的人运气好，试了5次就成功让这俩模型battle了一局。

结合几个示例来看，im-also-a-good-gpt2-chatbot生成的回答似乎总是更简洁一些。

代码生成方面，它能一次生成一个可执行的游戏代码。

提示词：Code Flappy Bird game in Python

效果如下：

如果回答的代码有误，可以进一步追问让它自己改正。

比如让它们写一个康威生命游戏的代码，在未告知使用Colab时，模型写出的代码有问题。

但继续追问并表示自己用的是Colab，im-also-a-good-gpt2-chatbot能够自己修改对代码，im-a-good-gpt2-chatbot不行。

还有在解决物理题方面，有Reddit用户说im-also-a-good-gpt2-chatbot能解答出其他模型都答不对的物理题。

问题：绿灯侠从一栋高楼楼顶跳下，他从静止状态开始做自由落体运动到地面，在他下落过程的最后1秒时，距离地面的距离是大楼一半的高度，这座楼有多高？

不过我们实测了下，im-a-good-gpt2-chatbot似乎也能做对。

还有人测试了一道推理题目，im-a-good-gpt2-chatbot可回答正确，im-also-a-good-gpt2-chatbot也能做到但需要两次提示。

问题：现在有两个足球队。球队A赢了8次，球队B赢了5次，已知还剩7次比赛，球队B想要赢得整场比赛，还需要至少赢几次？

网友：白嫖大家反馈吗？

尽管OpenAI还是没有正式认领gpt2-chatbot，但网友几乎已经默认它们是一家了。

因此有人觉得，gpt2-chatbot在竞技场上搞A/B测试，这不是让大家免费给他当志愿者。

OpenAI想要对内部模型进行人工评估，应该付给测试人员报酬，而不是在免费社区做。

有人觉得他们这么做，就是为了炒热度。

但现在gpt2-chatbot的底层模型到底是啥还不确定。

有人直接问了gpt2-chatbot，但可能存在幻觉，它表示自己基于GPT-4架构，是GPT-4.5的变体。

但之前奥特曼在公开演讲中已经否定了。测试网友表示自己没有给出过GPT-4.5相关的提示内容。

也有人怀疑，这两个模型大小不一样，叫这个名字是不是因为采用了GPT-2的架构来训练模型。

这和单纯的MoE不同，它们使用了Q*、合成数据，Sam的推特编辑历史是不是暗示了这一点？

值得一提的是，最近有大V爆料称本周OpenAI将公布进军搜索引擎的消息。

OpenAI已经更新了网站主页，第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”

爆料说这次发布的时间可能在北京时间周五的凌晨2点。

总之，最近OpenAI的动向，都有点神秘。

参考链接：
[1]https://twitter.com/itsandrewgao/status/1787758687651811705
[2]https://twitter.com/DimitrisPapail/status/1787899811514982887
[3]https://twitter.com/AlphaSignalAI/status/1786025388902097077
[4]https://gizmodo.com/powerful-new-gpt2-chatbot-mysteriously-returns-1851460717

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

刚刚，微软掀起生产力革命！GPT-4o 重塑 Windows，奥特曼登场剧透新模型神秘GPT模型引爆社区，GPT-4.5、GPT-5谣言满天飞，奥特曼在线围观 Llama 3每秒输出800个token逼宫openAI！下周奥特曼生日或放出GPT-5？GPT-5 体验首次曝光！发布时间也被剧透，来看看这些内幕消息微软颠覆生产力：Copilot推自定义版，AI PC原生支持PyTorch，奥特曼预告新模型微软加速AI生产力革命！GPT-4o 重塑 Windows，奥特曼“意外闪现”爆料下一个重要模型奥特曼承认了神秘gpt2！哈佛MIT巡演继续，斯坦福演讲完整版公开 OpenAI陷史上最大危机！奥特曼否认霸王条款急推背锅侠，网友：他撒谎成性神秘大模型一夜刷屏，能力太强被疑GPT-4.5，奥特曼避而不答打哑谜成也奥特曼, 败也奥特曼的IPO OpenAI 官宣旗舰模型 GPT-4o，完全免费、无障碍与人交谈！奥特曼：这是我们最好的模型 OpenAI CEO下场回应「封口协议」，争议还是到了股权利益上，奥特曼：我的锅学什么准备未来（三）新能源没能量笑談國之怪現況 51 兩會總理記者招待會 GPT-4o深夜炸场！AI实时视频通话丝滑如人类，Plus功能免费可用，奥特曼：《她》来了 AI搜索独角兽正进行2.5亿美元融资；黑客发布破解版ChatGPT；传奥特曼计划将OpenAI重组为营利性公司丨AI情报局周处除三害，胡因梦，灵修（2）OpenAI重磅更新定档下周一，奥特曼暗示会有「魔法」！OpenAI 要出什么大招？奥特曼可能已经在这个访谈里剧透了两重惊喜！奥特曼预告GPT-4和ChatGPT重大更新，Open AI要放大招 OpenAI 惊天内幕曝光！高管怒斥遭打压，离职吐槽公司将损失数百万，奥特曼紧急回应 OpenAI神秘搞事，GPT-4.5默默上线？推理碾压GPT-4网友震惊，奥特曼笑而不语 OpenAI下周要有大动作，奥特曼在线剧透：不是GPT-5，不是搜索引擎神秘模型gpt2-chatbot实力被赞超越GPT-4：sam亲自确认，或是OpenAI全新模型 OpenAI首席科学家宣布离职，曾参与驱逐CEO奥特曼；马斯克称OpenAI最新模型“慢得离谱”丨AIGC日报千古中华魂奥特曼小作文否认OpenAI离职霸王条款，网友：他有前科微软深夜再掀AI生产力革命，奥特曼登台「自曝」新模型！定制Copilot十亿打工人狂欢该结婚则结婚,该生则生;不育不孕的烦恼;尹烨谈念头;浙里办相亲面对质疑，奥特曼终于公开了OpenAI 前沿大模型安全架构发布会对比惨烈，奥特曼发文暗讽谷歌！谷歌被曝疯狂重组迎击OpenAI OpenAI抓内鬼出奇招，奥特曼耍了所有人奥特曼本人确认：神秘gpt2不是GPT-4.5！OpenAI抓内鬼出奇招，奥特曼耍了所有人：GPT搜索鸽了！改升级GPT-4 老黄亲自上门送超算！OpenAI奥特曼签收后到斯坦福演讲GPT-5

热点事件追踪

美国公司裁员Layoff

2024-01-28 18:01

2024-01-09 19:01

2024-01-07 18:01

美国堕胎权争议

2024-01-06 18:01

美国枪击案

2024-01-06 18:01

2023-12-13 17:12

2023-12-02 07:12

2023-11-26 18:11

中美航班重磅消息！每周85班，直飞更方便！

微软、亚马逊、谷歌大裁员！哪些科技和零售公司有缩减规模计划？

中国外长王毅：中美关系已经止跌回稳

脱轨事故造成20多人受伤联邦调查纽约市全部地铁系统

更多 2024-06-09 的新闻