Redian新闻
>
Vicuna:与ChatGPT 性能最相匹配的开源模型

Vicuna:与ChatGPT 性能最相匹配的开源模型

科技
Vicuna (由stable diffusion 2.1生成)

前言

最近由UC Berkeley、CMU、Stanford, 和 UC San Diego的研究人员创建的 Vicuna-13B,通过在 ShareGPT 收集的用户共享对话数据中微调 LLaMA获得。其中使用 GPT-4 进行评估,发现Vicuna-13B 的性能达到了ChatGPT 和 Bard 的 90% 以上,同时在 90% 情况下都优于 LLaMA 和 Alpaca 等其他模型。训练 Vicuna-13B 的费用约为 300 美元。训练和代码[1]以及在线演示[2]已公开。

Vicuna到底怎么样?

Vicuna在官网中通过和Alpaca、LLaMA、ChatGPT和Bard对比,然后通过GPT4当裁判来打出分数,具体如下。

问题
Alpaca-13b vs Vicuna
LLaMA-13b vs Vicuna
ChatGPT vs Vicuna
Bard vs Vicuna

可以看出,Vicuna的回答还是非常棒的,让GPT4来打分,Vicuna和ChatGPT是十分接近的,远远高于Alpaca和LLaMA。

如果大家想试试别的问题,可以自己去尝试[3]哈。

可换不同类型的不同问题

然而,官方认为评估聊天机器人绝非易事,听过GPT4进行评估是一件十分不严格的事情,但是目前还是无法解决评估的问题,需要后续学者进行进一步探索。

图1 GPT-4 评估

在线demo

可以在线品尝:https://chat.lmsys.org/。

概述

图2 工作流

图 2 介绍了整体工作流程。训练是在一天时间在 8 个 A100 上使用 PyTorch FSDP 完成的。 LLaMA、Alpaca、ChatGPT 和 Vicuna 的详细比较如表 1 所示。

表1 一些模型的对比

训练

Vicuna 是通过使用从 ShareGPT.com 使用公共 API 收集的大约 7万 用户共享对话微调 LLaMA 基础模型创建的。为了确保数据质量,将 HTML 转换回 markdown 并过滤掉一些不合适或低质量的样本。此外,将冗长的对话分成更小的部分,以适应模型的最大上下文长度。

训练方法建立在斯坦福alpaca的基础上,并进行了以下改进。

  • 内存优化:为了使 Vicuna 能够理解长上下文,将最大上下文长度从alpaca 中的 512 扩展到 2048。还通过gradient checkpointingflash attentio来解决内存压力。
  • 多轮对话调整训练损失考虑多轮对话,并仅根据聊天机器人的输出进行微调。
  • 通过 Spot 实例降低成本:使用 SkyPilot 托管点来降低成本。该解决方案将 7B 模型的训练成本从 500 美元削减至 140 美元左右,将 13B 模型的训练成本从 1000 美元左右削减至 300 美元。
图3 通过GPT4来评估打分
通过GPT4评估得出的总分

github: https://github.com/lm-sys/FastChat
Vicuna-13B: https://github.com/lm-sys/FastChat#vicuna-weights

进NLP群—>加入NLP交流群(备注nips/emnlp/nlpcc进入对应投稿群)

持续发布自然语言处理NLP每日优质论文解读、相关一手资料、AI算法岗位等最新信息。

加入星球,你将获得:

1. 每日更新3-5篇最新最优质的的论文速读

2. 最新入门和进阶学习资料

4. 每日1-3个NLP、搜广推、CV等AI岗位招聘信息


参考资料

[1]

Vicuna代码: https://github.com/lm-sys/FastChat

[2]

Vicuna demo: https://chat.lmsys.org/

[3]

官方blog: https://vicuna.lmsys.org/

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
斯坦福70亿参数开源模型媲美GPT-3.5,100美元即可复现ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!宾州德文(Devon)马术表演,从小培养谢娜张杰夫妇在上海买6000万豪宅“跳单”?法院判了!南都评论:中介必须要提供与之相匹配的附加值一面湖水Agustín Hernández:中美洲建筑背景下的未来主义巨构微软再扔AI聊天画图炸弹!视觉模型加持ChatGPT,Visual ChatGPT横空出世【立春】妈妈的春饼· 一荤一素开源版ChatGPT,30分钟训完,性能堪比GPT3.5!300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了LeCun吴恩达开直播,疾呼GPT-5不能停!LeCun:干脆管制凤头鹦鹉6个月IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT能写长篇小说了,ETH提出RecurrentGPT实现交互式超长文本生成叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型早报 | 李彦宏:与ChatGPT差距取决于努力;杭州高价打捞手机为自导自演;11部门出手:医美属医疗;曝梅西率队来华约战国足免费可商用开源GPT模型问世,50G权重直接下载,性能不输GPT-30门槛克隆ChatGPT方案再升级,开源模型完整复现,在线体验无需注册GPT-4苏醒,AI要「杀」人?Hinton、ChatGPT之父预警,LeCun怒怼:不如我家狗ImageNet零样本准确率首次超过80%!OpenCLIP:性能最强的开源CLIP模型ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载ChatGPT爆火,LeCun心态崩了!称大语言模型是邪路,Meta模型3天惨遭下线号称可以成为 ChatGPT 平替的开源模型 “Dolly” | Linux 中国老金的黄金梦包邮送6本!NLP与ChatGPT的碰撞:大模型和小模型联合发力青椒炒肉丝很恐怖吗?开源版ChatGPT来了?多数任务效果超越GPT3,已开源!性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型ChatGPT自己会选模型了!微软亚研院+浙大爆火新论文,HuggingGPT项目已开源ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。