Redian新闻
>
清华CodeGeeX项目原作解读:大规模多语言代码生成模型

清华CodeGeeX项目原作解读:大规模多语言代码生成模型

公众号新闻

近年来,大规模预训练模型在各个领域取得飞速进步,不仅是文本、图像领域,用于代码领域也可以取得惊人的效果。OpenAI 的 Codex 模型首次展示了代码预训练模型的强大能力,并以此为基础开发了 Copilot 插件。然而,闭源、收费等特性使 Copilot 饱受研究者和程序员们的争议。

为了让更多研究者能参与到这一领域的探索、让广大程序员能够免费体验到自动代码生成带来的便利,清华大学知识工程实验室团队主导研发了 CodeGeeX,一个具有 130 亿参数的多编程语言代码生成预训练模型,采用华为 MindSpore 框架实现,在鹏城实验室 “鹏城云脑 II“平台上使用 1536 个昇腾 910 AI 处理器,在 20 多种语言的语料库上历时两个月训练得到。CodeGeeX 支持十多种主流编程语言的生成及翻译,在新的多语言基准 HumanEval-X 取得超过所有开源模型的效果。此外,团队和智谱 AI 合作,基于 CodeGeeX 开发了免费的 VS Code 插件,同时正在开发其他平台插件,帮助广大程序员提高开发效率。CodeGeeX 开源开放,所有代码和模型权重均已开源,并同时支持昇腾和英伟达平台。

机器之心最新一期线上分享邀请到了清华大学知识工程实验室研究助理郑勤锴,介绍 CodeGeeX 的技术原理、实现过程、评估指标,以及插件的使用教程等。

分享主题:CodeGeeX:大规模多语言代码生成模型

分享嘉宾:郑勤锴,清华大学知识工程实验室研究助理,本科及硕士毕业于上海交通大学,并取得巴黎高等电信学校工程师学位,研究领域是基于预训练模型的代码生成。

分享摘要:CodeGeeX 是一个具有 130 亿参数的多语言代码生成预训练模型,由清华大学知识工程实验室团队研发,支持十多种主流编程语言的生成及翻译,并开发了免费的 VS Code 插件,帮助广大程序员提高开发效率。本次报告将介绍 CodeGeeX 的技术原理、实现过程、评估指标,以及插件的使用教程等。

相关链接:

1)SOTA!模型平台项目主页链接:

https://sota.jiqizhixin.com/project/codegeex

2)GitHub 链接:

https://github.com/THUDM/CodeGeeX

3)技术博客:

https://models.aminer.cn/codegeex/blog/index_zh.html

4)主页(含在线DEMO):

https://models.aminer.cn/codegeex/zh-CN/

5)免费的 VS Code 插件:

https://marketplace.visualstudio.com/items?itemName=aminer.codegeex

加群看直播
直播间关注机器之心机动组视频号,北京时间 11 月 7 日 19:00 开播。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。


如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「CodeGeeX」即可加入。
如果你也有最新工作希望分享或提交你感兴趣的内容方向,随时告诉我们吧:https://jiqizhixin.mikecrm.com/fFruVd3

机器之心 · 机动组
机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
抓住夏天的尾巴 - 古巴行1 Cayo Coco「多语言图像描述」最强评估基准XM3600来了!涵盖36种语言EEGLAB系列教程1:安装和启动 EEGLAB南半球的油菜花开啦微信推出自研NLP大规模语言模型WeLM:零/少样本即可完成多种NLP任务,匹敌大其25倍的模型谷歌Imagen首次开放测试,安卓苹果都能玩,还有AI写作助手、超长连贯性视频生成模型傅雷的家书和他的遗言—傅雷夫妇56年祭日华南理工TANGO项目原作解读: 文本驱动的三维物体风格化模型NeurIPS 2022 | 准确建模多智能体系统,斯坦福提出隐空间多层图模型突发: 魁省CEGEP大规模警察封锁! 堵门关灯, 搜查书包, 两人被捕…7 Papers & Radios | 扩散模型只用文字PS照片;MIT泊松流生成模型击败扩散模型EEGLAB系列教程2:在 EEGLAB 中管理数据集端到端音视频说话人日志网络,一作解读INTERSPEECH 2022论文热点解读:大模型的突现能力和ChatGPT引爆的范式转变PromptCLUE:大规模多任务Prompt预训练中文开源模型2022傅雷翻译出版奖获奖者揭晓 Le palmarès du Prix Fu Lei 2022 dévoilé卷!MIT提出泊松流生成模型击败扩散模型,兼顾质量与速度EEGLAB系列教程3:在 EEGLAB 中建立location下面说的退休了无聊我能理解,所以需要在退休以前就先把路子趟出来。张柏芝大料!2500万资助这个男人,自己却租房穿旧鞋逛温哥华Costco?浅谈 Go 语言代码注释问题UniMatch项目原作解读:统一光流、立体匹配和深度估计三个任务规模多少算小市值?3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,给一个文本提示就能生成3D模型!CLUE社区最新神器!PromptCLUE:大规模多任务Prompt预训练中文开源模型GAN、扩散模型应有尽有,CMU出品的生成模型专属搜索引擎Modelverse来了Uni-Mol:分子3D表示学习框架和预训练模型项目原作解读卷!MIT泊松流生成模型击败扩散模型,兼顾质量与速度如何生成「好」的图?面向图生成的深度生成模型系统综述|TPAMI2022TPAMI 2023 特刊征稿!大规模多模态学习!我在中美两国当工人的不同感受
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。