Redian新闻
>
官方的Code Llama开源:免费商用,神秘版本接近GPT-4

官方的Code Llama开源:免费商用,神秘版本接近GPT-4

公众号新闻

机器之心报道

编辑:杜伟、陈萍

GPT-4:在代码生成这块,你们依然是「弟弟」。

今日,Meta 的开源 Llama 模型家族迎来了一位新成员 —— 专攻代码生成的基础模型 Code Llama。


作为 Llama 2 的代码专用版本,Code Llama 基于特定的代码数据集在其上进一步微调训练而成。


Meta 表示,Code Llama 的开源协议与 Llama 2 一样,免费用于研究以及商用目的。



相关论文《Code Llama: Open Foundation Models for Code》已经公布,足足有 47 页,作者有 25 位。



论文地址:https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/

GitHub 地址:https://github.com/facebookresearch/codellama


Code Llama 系列模型有三个版本,参数量分别为 7B、13B 和 34B。并且支持多种编程语言,包括 Python、C++、Java、PHP、Typescript (Javascript)、C# 和 Bash。


Code Llama 稳定支持了最高 10 万 token 的上下文生成。下图 2 为 Code Llama 的微调流程。



就其效果来说,Code Llama 的不同版本在 HumanEval 和 MBPP 数据集上的一次生成通过率(pass@1)都可以超越 GPT-3.5。


另外,Code Llama 的「Unnatural」34B 版本在 HumanEval 数据集上的 pass@1 接近了 GPT-4(62.2% vs 67.0%)。Meta 没有发布这个版本,但通过一小部分高质量编码数据的训练实现了明显的效果改进。



这个特殊版本引起了很多人的注意,其中就有特斯拉前 AI 总监、回归 OpenAI 的 Andrej Karpathy。


文中虽然提到它是「在 15000 个 unnatural 指令上微调的 Code Llama-Python 34B 版本」,但 Karpathy 仍然对这个「神秘的名称、模糊的描述、碾压其他的保密模型」感到很好奇。



Code Llama 如何工作


Code Llama 编码能力非常强,它可以根据代码和自然语言提示生成代码(例如用户输入提示「帮我写一个输出斐波那契序列的函数。」) 它还可帮助用户进行代码补全和调试代码。 



三个参数版本的 Code Llama 模型都使用了 500B 的代码 tokens 和代码相关数据进行训练。7B 和 13B 基础和指令模型也经过了 FIM(fill-in-the-middle)训练,从而允许将代码插入到现有代码中,这意味着它们可以支持开箱即用的代码补全等任务。


下表为 Code Llama 的训练数据集。



有了这三种模型,不同的服务和延迟要求都能得到满足。例如,7B 模型可以在单个 GPU 上运行;34B 模型能够返回最佳结果并提供更好的编码辅助,但就速度而言,较小的 7B 和 13B 模型速度更快,更适合低延迟任务,例如实时代码补全。



Code Llama 不仅提供了多达 100000 个上下文 token 的稳定生成,所有模型的训练 token 序列也高达 16000。


除了作为生成更长程序的先决条件外,拥有更长的输入序列也为 Code Llama 带来新的功能。例如,用户可以为模型提供来自他们代码库的更多上下文,以使生成的代码更相关。



值得一提的是,Meta 更进一步微调了 Code Llama 的两个附加变体:Code Llama - Python 和 Code Llama - Instruct。


Code Llama-Python 是 Code Llama 的一种变体,其在 Python 代码的 100B token 上进一步微调。下表为 Code Llama-Python 的训练数据集。



Code Llama - Instruct 是 Code Llama 的指令微调和对齐变体,能够更好地理解输入提示。Meta 建议在使用 Code Llama 进行代码生成时使用 Code Llama - Instruct 变体,因为 Code Llama - Instruct 已经过微调,可以用自然语言生成有用且安全的答案。


Meta 表示,他们不建议使用 Code Llama 或 Code Llama - Python 执行一般的自然语言任务,因为这两个模型都不是为遵循自然语言指令而设计的。Code Llama 专门用于特定于代码的任务,不适合作为其他任务的基础模型。


使用 Code Llama 模型时,用户必须遵守许可和使用政策。


Code Llama 性能如何


Meta 使用了 HumanEval 和 MBPP(Mostly Basic Python Programming)两个编码基准进行测试。其中,HumanEval 测试模型基于文档字符串(docstrings)完成代码的能力,MBPP 测试模型基于描述编写代码的能力。


结果表明,Code Llama 的性能优于开源、特定于代码任务的 LLM,并且优于自家 Llama 2。例如,Code Llama 34B 在 HumanEval 上得分为 53.7%,在 MBPP 上得分为 56.2%,与其他最先进的开源解决方案相比是最好的,与 ChatGPT 相当。



不过,Code Llama 也存在风险,Meta 表示构建负责任地 AI 模型至关重要,他们在发布 Code Llama 之前采取了许多安全措施。作为红队测试工作的一部分,Meta 对 Code Llama 生成恶意代码的风险进行了定量评估。他们创建了一些提示,以试图让模型生成恶意代码,并将 Code Llama 对这些提示的响应与 ChatGPT (GPT3.5 Turbo) 进行比较。结果发现,Code Llama 的回答更安全。


由此看来,编码能力不是特别强的 Llama 2,这个坑已被 Code Llama 填上了。Meta 希望 Code Llama 的出现能够激励其他研究者基于 Llama 2 为研究和商业产品创建新的创新工具。


参考链接:

https://ai.meta.com/blog/code-llama-large-language-model-coding/



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
莫怨枯寒梅瓦格纳反水的启示---要善待厨子650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT彻底开源,免费商用,上海AI实验室把大模型门槛打下来人手一个编程助手!北大最强代码大模型CodeShell-7B开源,性能霸榜,IDE插件全开源最强“GPT-4平替”开源!Meta推出免费商用的Llama 2,联手微软掀全球AI狂欢完胜GPT-4,秒杀闭源模型!Code Llama神秘版本曝光最好的7B模型易主,笔记本轻松跑,免费开源可商用,来自“欧洲的OpenAI”对战GPT,Meta开源Code Llama!!!12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!逼近GPT-4,AI编程要革命!Meta开源史上最强代码工具Code Llama王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%第三章 旧文明的社会组织 (全文)免费、可商用,阿里云开源70亿参数通义千问大模型北交大开源交通大模型TransGPT·致远,可免费商用国内首款开源交通大模型TransGPT(致远),可免费商用开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI CodexMeta发布免费商用大模型 / 微信团队取消秋招/ iPhone 16 Pro Max拍照性能或大幅提升国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上Erklärung zur ZusammenarbeitMeta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用[9月26日]科学历史上的今天——金·赫尔尼(Jean Amédée Hoerni)Meta“搞大事”了:发布GPT“平替”Llama 2,开源、免费、还可商用!开源打败闭源?Meta 即将推出开源代码生成平台 Code Llama,剑指 OpenAI Codex旷视恢复IPO注册程序;清华ChatGLM2-6B模型免费商用;传马斯克的xAI估值200亿美元丨AIGC大事日报【公告】ChatGLM2-6B,免费商用百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元泰国诗圣苏东坡用GPT-4训练机器人,英伟达最新Agent开源:任务越复杂越拿手5100 血壮山河之武汉会战 浴血田家镇 8性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型一次通过率73%,开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。