Redian新闻
>
CodeGeeX2-6B开源,最低6GB显存,性能优于 StarCoder

CodeGeeX2-6B开源,最低6GB显存,性能优于 StarCoder

公众号新闻
GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2 架构注入代码实现。

我们希望每一位程序员,都能在自己机器上跑上一个自己的编程助手。为实现这一目标,我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我们也将对该模型持续进行迭代升级,以提供更加强大的代码辅助能力。

公告称,得益于 ChatGLM2 的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与 150 亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借 60 亿参数便具备了近 10% 的优势。
更多特性包括:
  • 更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了 600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在 Python 上达到 35.9% 的 Pass@1 一次通过率,超越规模更大的 StarCoder-15B。

  • 更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大 8192 序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需 6GB 显存即可运行,支持轻量级本地化部署。

  • 更全面的 AI 编程助手:CodeGeeX 插件(VS Code, Jetbrains)后端升级,支持超过 100 种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式 AI 编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。

  • 更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。

代码能力评测

CodeGeeX2 作为一个多语言代码生成基座模型,代码能力较上一代大幅提升,以下是在 HumanEval,HumanEval-X, DS1000 基准上的评测结果(评价指标 Pass@k 定义与论文中一致):

量化推理性能

CodeGeeX2 与上一代相比,对部署更加友好。得益于使用 Multi-Query Attention 和 Flash Attention,推理速度更快,且量化后仅需 6GB 显存即可运行:
量化
推理

相关链接:https://mp.weixin.qq.com/s/qw31ThM4AjG6RrjNwsfZwg

项目地址:https://www.oschina.net/p/codegeex2


END



2023年需求最大的8种编程语言:PHP强劲,C/C++需求放缓




这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4Der Maechtige Strom巨流河英伟达正准备推出具有 94GB 和 64GB 显存的 H100 Hopper 加速卡谁动了我的显存?——深度学习训练过程显存占用分析及优化【LEAP eSalon】Success Strategies on Job Search & Career ChangeSurface Laptop 4 1958 AMD Ryzen 5 16GB 256GB SSD SilverAI-Generated Fashion Models Are Hugely Popular — and Sexist水龙饮 船行感怀参数量仅为1/700,性能超越GPT-3.5!CMU+清华开源Prompt2Model框架16GB 大显存,微星发布 RTX 4060 Ti GAMING X SLIM WHITE 显卡2015 macbook pro 13in(i5 2.7gh/8g/256g)low battery circle *exploBlink实时计算:Explorer大基数表的写入性能优化华擎公布 A380 半高显卡:6GB 显存、DP 2.0 接口芝奇推出 48GB 单条 DDR5-6800 内存,96GB 套装 4198 元INNO3D GEFORCE GTX 1650 SUPER TWIN X2 OC开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex[评测]ASUS ProArt GeForce RTX 4080 OC Edition 16GB GDDR6X 评测[评测]ASUS ProArt GeForce RTX 4060 Ti OC Edition 16GB GDDR6 评测代码大战白热化:WizardCoder挑落Bard及Claude,性能直追ChatGPT开源打败闭源?Meta 即将推出开源代码生成平台 Code Llama,剑指 OpenAI CodexKindle DP75SDI Paperwhite 2GB WIFI & 3GB eReader - 2nd Gen (酷比魔方将推 iPlay 50 Pro 进阶版平板电脑,8GB+256GB 首发价 899 元Erklärung zur Zusammenarbeit多编程语言代码生成神器 CodeGeeX,编码效率提升十倍!1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升消息称苹果 M3 芯片 Mac 电脑将淘汰 8GB 内存,各版本机型以 12GB 起步俄罗斯科技巨头Yandex创建大模型YandexGPT,声称性能优于ChatGPT11个LLM一起上,性能爆炸提升!AI2联合USC开源LLM-Blender集成学习框架:先排序再融合|ACL 2023回来了AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑名城 查尔斯顿让注意力提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升!斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升色戒: 中国女人与外国男人
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。