Redian新闻
>
直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?

直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?

公众号新闻



  新智元报道  

编辑:Aeneas
【新智元导读】这几天引发了AI社区大讨论的逼近GPT-4性能的泄漏模型「miqu」,的确是Mistral公司训练的一个旧模型的量化版。此前,冲上各大榜单的这个开源模型引发开发者热议,开源AI或已进入关键时刻。
破案了!
让众多网友抓心挠肝的开源新模型「miqu」,的确是Mistral训练模型的一个旧的量化版本,是在Llama 2上重新训练的。
今天,Mistral CEO亲口确认了这一点。
CEO表示,模型是一位「过于热情的员工」从「抢先体验的客户」那里泄漏的。
过去几天,引起AI社区热烈讨论的这桩「悬案」,终于有了答案。

神秘模型泄漏

事情是这样的。
1月28日,一位名为「miqudev」的用户,在HuggingFace上发布了一组文件,这些文件共同构成了一个看似全新的开源LLM,名为「miqu-1-70b」。
奇怪的是,网友们在HuggingFace条目中发现,这个新模型的提示格式跟Mistral完全相同。
随后,「miqu-1-70b」的链接,又在4chan上泄漏了。
发布链接的,是4chan上的一位匿名用户,大家推测他极有可能是就「miqudev」。
随后,X上的网友们奔走相告,因为他们发现,miqu-1-70b的性能实在是太强了!
在EQ-Bench基准测试上,它甚至已经接近了之前的模型王者——GPT-4。
网友们百思不得其解,为什么这个神秘的新模型能击败Mistral Medium,接近GPT-4。
干脆有人提议,不如用EQ-Bench检查下,miqu的数据集是不是被污染了。

miqu模型真面目, 是Mistral还是Llama?

为了确定「miqu」的真实身份,有网友向Mistral-Medium和miqu发送了同一个俄语问题。
结果发现,两个模型的回答竟然是一模一样的俄语。
最后,他得出结论——我现在100%相信miqu就是Mistral-Medium。
更有网友熬夜进行了测试,比较了miqu和Mixtral模型的能力。
结果发现,miqu与Mixtral的确非常相似,无论在德语拼写和双语语法上,还是回复中的一些语言习惯上。
总的来说,miqu的表现优于Mistral Small和Medium,逊于Mixtral 8x7B Instruct。
因此,miqu可能是Mistral模型的泄漏版本,一个较旧的概念验证模型。
当然,也有部分开发者认为,miqu更像Llama 70B,而不是专家混合模型。
综合当时的推测来看,miqu既可能是Mistral Medium的早期版本,也可能是在Mistral Medium数据集上微调了Llama 70B。

Mistral量化版?

随着声浪越来越大,摩根大通的机器学习研究者Maxime Labonne也注意到了这件事。
他发帖称,「目前还不确定miqu是否就是Mistral量化版,但可以肯定,它很快就会成为最好的开源LLM之一。」
而且多亏了@152334H,现在大家已经有了一个未量化版本的miqu。
Labonne表示,现在调查还在继续,我们很快就会看到,微调版本的miqu性能会优于GPT-4了!
在机器学习中,量化指的是这种技术,通过用较短的数字序列替换模型架构中的特定长数字序列,使得在功能较弱的计算机和芯片上运行某些AI模型成为可能。
很多人猜,miqu很可能是一种新的Mistral模型,是公司故意要「泄漏」出去的。
毕竟上次的磁力链接事件就表明,Mistral一向有通过深奥的技术手段大张旗鼓地发布新模型的「传统」。
或者,也有可能是员工或者客户泄漏出去的。

CEO确认:没错,它是Mistral的量化版

今天,事情终于水落石出了。
Mistral的联创兼CEO Arthur Mensch在X上澄清道:
我们有一位抢先体验的客户,对接他的过于热情的员工泄漏了我们训练和公开分发的旧模型的量化和水印版本。
为了快速开始与一些选定的客户合作,我们在访问整个集群的那一刻,就从Llama 2重新训练了这个模型——预训练在Mistral 7B发布当天就完成了。从那以后,我们又不断取得了良好的进展,敬请期待!
有趣的是,CEO并没有要求HuggingFace上的帖子被删除,而是表示发帖人「可能需要考虑归属」。
总之,「敬请期待」这四个字表明,Mistral在训练的,似乎不仅仅是这个接近GPT-4的miqu模型。

开源AI进入关键时刻?

miqu模型的泄漏之所以能引起如此轩然大波,也是因为这件事很可能成为开源生成式AI的分水岭,以及整个AI和计算机科学领域的分水岭。
2022年3月发布的GPT-4,在大多数基准测试中仍然是世界上性能最强的LLM。甚至连谷歌传闻已久的 Gemini都无法超越它。(根据一些测试,目前的 Gemini模型实际上比旧的OpenAI GPT-3.5 模型还要差)。
如果现在有一个类似GPT-4性能的模型出来,且能免费商用,就必然给OpenAI及其订阅服务带来巨大的冲击。
尤其是现在越来越多的企业开始寻求开源模型或开源和闭源的混合,来支持自己的应用程序。
靠着GPT-4 Turbo和GPT-4V,OpenAI已经竭尽全力保持优势,但开源AI社区的迅速追赶,已经不容忽视了。
OpenAI是否有足够的领先优势,GPT Store和其他功能是否具有护城河,让ChatGPT停留在LLM榜首的位置呢?
参考资料:
https://venturebeat.com/ai/mistral-ceo-confirms-leak-of-new-open-source-ai-model-nearing-gpt-4-performance/



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
“返乡过年要报备”,后续来了:多部门相互甩锅,官方发声,评论区炸锅……媲美GPT-4的开源模型泄露!Mistral老板刚刚证实:正式版本还会更强人生若只如初见(十一)周末随笔OpenAI“宿敌”:放松不了一点!开源模型一不小心就变安全“卧底”GPT Store来了,OpenAI着急让开发者赚到钱开源日报 | 微软AI程序员登场,马斯克开源Grok;Open-Sora全面开源自曝是羽生结弦前女友?俄斯花滑美女疑暗讽羽生没担当,敢爱不敢认?!Transformer挑战者出现!斯坦福CMU联合团队,开源模型及代码,公司已创办开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了OpenAI一键调用GPTs功能上线;Alphabet CEO皮查伊:Gemini Ultra AI模型将很快面世丨AIGC日报最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发OpenAI CEO称GPT-5发布前会发一批新产品;Airbnb前高管将加入OpenAI担任高管丨AIGC日报不仅做GPT Store,OpenAI还要做AI搜索引擎|甲子光年不仅做GPT Store,OpenAI还要做AI搜索引擎小模型性能直逼GPT-4?北航等提出基于强弱模型协同的ICL增强新范式AI早知道|ChatGPT模型大更新;阿里云发布多模态大模型;百度推多模态模型UNIMO-G怕了!加拿大超市巨头“被逼”宣布降价!网友不买账,评论区炸锅...刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型国内多所高校共建开源社区LAMM,加入多模态语言模型大家庭的时候到了俄花滑美少女冠军自曝是羽生结弦前任?暗嘲他恋爱2年不敢认,看她被网暴无动于衷?《伪君子基辛格》GPT-5不叫GPT-5?OpenAI CEO曝出AGI即将来临,重点押注核聚变事态再升级!邢台裁缝怒怼城管后续:店主残疾被优待,评论区炸锅……GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发性能逼近GPT-4,开源Mistral-Medium意外泄露?CEO最新回应来了中国军人的军装更换频繁吗?评论区炸锅了国产「GPTs」上线!全面对标 OpenAI 的智谱发布大模型,性能逼近 GPT-4国产开源模型标杆大升级,重点能力比肩ChatGPT!书生·浦语2.0发布,支持免费商用GPT Store下周赶场,OpenAI应用大爆发箭在弦上!最全GPT Builder使用指南来了work & pray only matter.president John Quincy Adams left to马斯克发全球最大开源模型!3140亿参数的Grok真打脸OpenAI了?《歌德堡变奏曲1503》Stability CEO自己跑路:没董事会控制权;月之暗面Kimi火爆至宕机,已扩容5次;王小川怼李彦宏:活在幻觉中|AI周报抱抱脸正面挑战OpenAI,推出开源版GPT商店!完全免费、支持六大开源模型当底座
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。