Redian新闻
>
Stability AI火速发布Llama 2微调模型FreeWilly,性能媲美ChatGPT!网友惊呼游戏规则已改变

Stability AI火速发布Llama 2微调模型FreeWilly,性能媲美ChatGPT!网友惊呼游戏规则已改变

公众号新闻



  新智元报道  

编辑:好困 Aeneas
【新智元导读】Llama 2刚发布没两天,独角兽Stability AI就已经火速微调出了FreeWilly模型,据称性能已经可与ChatGPT媲美。

Meta的Llama 2一发布,就引爆了整个开源社区。

正如OpenAI科学家Karpathy所说,对于整个大语言模型领域来说,这是极其重要的一天。在开放权重的所有模型中,Llama 2是最强大的一个。

从此,开源大模型与闭源大模型的差距将进一步缩小,构建大模型的机会,从此对所有开发者都是平等的。

就在刚刚,Stability AI和CarperAI实验室联合发布了基于LLaMA 2 70B模型的微调模型——FreeWilly2。
以及,基于LLaMA 65B原始模型微调的——FreeWilly1。
值得注意的是,模型采用了基于标准Alpaca格式,并经过监督微调(SFT)的全新合成数据集来进行训练。
在各项基准测试中,FreeWilly2都展现出了卓越的推理能力,甚至有部分任务还超过了GPT-3.5。

模型地址:https://huggingface.co/stabilityai/FreeWilly2

模型地址:https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor
这两款模型都是研究实验,并在非商业许可下发布。

数据生成与收集

Stability AI表示,FreeWilly模型的训练是受到了微软论文《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》的直接启发。
不过,虽然数据生成过程类似,但来源却有所不同。

论文链接:https://arxiv.org/pdf/2306.02707.pdf
FreeWilly的数据集变体包含有60万个数据点(大约是原始Orca论文使用的数据集大小的10%),并通过使用Enrico Shippole创建的高质量指令数据集,对模型进行了引导:

- COT Submix Original

- NIV2 Submix Original

- FLAN 2021 Submix Original

- T0 Submix Original
通过这种方法,Stability AI使用了一个较简单的LLM模型生成了50万个示例,再使用一个更复杂的LLM模型生成了额外的10万个示例。
为了进行公平比较,Stability AI精心筛选了这些数据集,并删除了来源于评估基准的示例。
尽管训练样本量仅为原始Orca论文的十分之一,但由此生成的FreeWilly模型,不仅在各种基准测试中都表现出色,而且也验证了合成生成数据集方法的可行性。

模型性能的评估

在性能评估方面,Stability AI的研究人员采用了EleutherAI的lm-eval-harness,并加入了AGIEval。
从结果来看,FreeWilly在很多方面都表现出色,包括复杂的推理、理解语言的微妙之处,以及回答与专业领域相关的复杂问题(如法律和数学问题解决)。
基本上,FreeWilly 2已经实现了与ChatGPT相当的水平,甚至在有些评测上更胜一筹。
GPT4ALL基准(0-shot):
AGI评估(0-shot):
除此之外,来自Hugging Face的团队也在7月21日对实验进行了独立复现。
可以看到,在Open LLM排行榜上,FreeWilly 2以绝对领先的优势排在第一,平均得分比原始版的Llama 2高了4个百分点。

为了开放的未来


可以说,FreeWilly1和FreeWilly2为开源大语言模型树立了新的标准。
这两个模型的推出,不仅极大地推进了相关领域的研究,增强了自然语言理解能力,而且还支持复杂任务的完成。
Stability AI表示,团队为这些模型能AI社区带来的无限可能感到非常兴奋,并期待着那些因它们而激发出全新应用。
此外,也衷心感谢充满激情的研究人员、工程师和合作伙伴团队,是他们的卓越努力和奉献,使Stability AI能够达到这一重要里程碑。

激动人心的时刻

模型一经发布,网友「Phil Howes」就利用Tuhin Srivastava的Llama v2框架,在不到一分钟时间就完成了FreeWilly 2的实现。
经过275GB的权重加载后,模型的运行速度在开箱即用的情况下达到了23 token/s。
另外,还有网友惊呼:Stability AI和CarperAI联合推出的模型,堪称是对游戏规则的改变!
FreeWilly1和FreeWilly2在开源和性能方面具有极大的创新意义,AI圈正在迎来令人激动的时刻。
参考资料:
https://stability.ai/blog/freewilly-large-instruction-fine-tuned-models




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
苹果市值数秒暴涨600亿美元!秘密开发大模型Apple GPT,员工自曝:复制的ChatGPT!GPT-4 API平替?性能媲美同时成本降低98%,斯坦福提出FrugalGPT,研究却惹争议DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率最强API调用模型来了!基于LLaMA微调,性能超过GPT-4eSIM重磅进展!物联网市场的游戏规则改变者来了【城事】巴黎市长将重修Châtelet 广场以方便行人OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南5076 血壮山河之武汉会战 黄广战役 8PS直接革自己命!AI功能迎来史诗级加强,网友:改变游戏规则官宣!更懂你的China Daily Z Weekly,全新上线!代码大战白热化:WizardCoder挑落Bard及Claude,性能直追ChatGPT2023回国 同学聚会(图)你好,我是筚(bì)篥( lì)!击败ChatGPT?OpenChat霸榜斯坦福AlpacaEval开源榜首,性能高达105.7%GPT-3.5 Turbo支持微调了,打造专属ChatGPT,但价格小贵ChatGPT能写长篇小说了,ETH提出RecurrentGPT实现交互式超长文本生成美丽的清晨,美好的一天AI之下没有秘密:网友诱骗ChatGPT激活 Windows 11,ChatGPT落入陷阱!Google语言模型反击战!部分性能超越ChatGPT!改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻改变游戏规则:新的中国私募基金监管政策深度解析 | 上巴黎市长将重修Châtelet 广场以方便行人爱是做出来的As Viewers Fret, China Vows to Streamline Fees for OTT Content《消失的她》爆火,这位“香港最后的女神”功不可没!网友惊呼:35岁比18岁还靓ChatGPT开源平替:OpenAssistant OASST1微调版Pythia-12B1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4TikTok的新计划将改变游戏规则旧车变超跑!澳男用ChatGPT改装汽车,摇身一变增值$6万,性能堪比奔驰宝马(组图)1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布Holt Renfrew狂降价!Acne,Theory,Ami,Ganni巨折!单GPU实现99%ChatGPT性能,「原驼」火了:手机也能微调大模型昊字现在在姓名中很流行太张狂!多伦多歌手牢中发布单曲MV!网友惊呼:监狱说唱!俄罗斯科技巨头Yandex创建大模型YandexGPT,声称性能优于ChatGPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。