手把手教你剪「羊驼」,陈丹琦团队提出LLM-Shearing大模型剪枝法
机器之心报道
机器之心编辑部
给 Llama 2(羊驼)大模型剪一剪驼毛,会有怎样的效果呢?今天普林斯顿大学陈丹琦团队提出了一种名为 LLM-Shearing 的大模型剪枝法,可以用很小的计算量和成本实现优于同等规模模型的性能。
论文地址: https://arxiv.org/abs/2310.06694 代码地址: https://github.com/princeton-nlp/LLM-Shearing ModelsSheared-LLaMA-1.3B, Sheared-LLaMA-2.7B
第一阶段将 M_S 剪枝为 M_T,虽然这样减少了参数数量,但不可避免地导致性能下降; 第二阶段持续预训练 M_T,使其性能更强。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章