Alpaca-CoT项目原作解读:多接口统一的轻量级LLM指令微调平台
近期,LLaMA 显示出惊人的 zero-shot 和 few-shot 能力,仅需较少的 13B 参数即可在大多数 benchmarks 上显著优于 GPT-3(175B),而 LLaMA-65B 可与 PaLM-540B 相当。LLaMA 的出现重新定义了 Large Language Models (LLMs) 的 “Large”,明显降低了 competitive LLMs 的规模。
紧接着, Stanford Alpaca 借助 self-instruct 的方式生成的 52K English Instruction-Fine Tuning (IFT) 数据对 LLaMA-7B 进行了微调,赋予了其可观的 instruction-following 能力。相比于 GPT-4 训练和 inference 阶段巨大资源消耗和时间成本,或许较小版本的 LLMs 才是通向 AGI 的一个更好的 solution。
然而,目前在 LLM 上的 IFT 的研究仍然面临着以下三个挑战:
1、即便对仅有 7b 大小的 LLM 进行微调,依然对计算资源有着较高的要求;
2、用于指令微调的开源数据集较少,缺少相关资源的整合工作;
3、缺少统一的平台,可以轻松切换不同的 LLMs 和不同类型的 IFT 数据,以进行系统性的研究和对比;
为了便于研究者们在 LLMs 上做系统的 IFT 研究, Alpaca-CoT 项目结合了相关的近期前沿技术,具有以下优势:
1、结合了 low-rank adaptation (LoRA), PEFT 等技术来降低计算资源需求。
2、持续更新和维护了一个大规模的 IFT 数据集合(见下图)。这些数据已被统一格式,包含了中文、multi-language、Chain-of-Thought、code、story generation 等。
3、集成了多种 LLMs (如 LLaMA, ChatGLM 和 Bloom) 并统一了调用接口,可通过超参轻松切换,后续将持续集成更多 LLMs。
Alpaca-CoT 吸引了大批具有相同兴趣的开源爱好者和 LLM 研究者,不断注入最新的 LLM-IFT 技术。
机器之心最新一期线上分享邀请到了中国科学院信息工程研究所博士生佀庆一,为大家分享他们近期的开源项目 Alpaca-CoT。
分享主题:Alpaca-CoT: 多接口统一的轻量级LLM指令微调平台
分享嘉宾:佀庆一,中国科学院信息工程研究所博士生,感兴趣于视觉问答、OOD鲁棒性、LLM和VLP等方向,曾在ACL, EMNLP, IJCAI, MM等顶会上发表多篇论文。
分享摘要:为了加速复现 ChatGPT 的进程,降低研究者们上手 LLM-IFT 相关研究的门槛,该项目团队开源了 Alpaca-CoT 项目,搭建了数据、LLMs 多接口统一的 LLM-IFT 研究平台。在本次分享中,将系统地分享目前项目以及 LLM-IFT 研究方向所涉及到的相关概念和技术,以及对未来的展望。
相关链接:
1)SOTA!模型平台项目主页链接:
https://sota.jiqizhixin.com/project/alpaca-cot
3)代码仓库:
https://github.com/PhoebusSi/Alpaca-CoT
微信扫码关注该文公众号作者