Redian新闻
>
北大开源代码大模型CodeShell,提供了配套的IDE插件

北大开源代码大模型CodeShell,提供了配套的IDE插件

公众号新闻

出品 | OSC开源社区(ID:oschina2013)

北京大学知识计算实验室联合四川天府银行 AI 团队,正式开源 70 亿参数的代码大模型 CodeShell,并提供了与 CodeShell 配套的部署方案与 IDE 插件,具体查看 CodeShell 代码库(https://github.com/WisdomShell/codeshell)。

官方介绍称,CodeShell 具有 70 亿参数,采用五千亿 Tokens 进行了训练,上下文窗口长度为 8192。CodeShell 的原始训练数据基于自己爬取的 GitHub 数据、Stack 和 StarCoder 数据集,以及少量高质量的中英文数据。

在权威的代码评估 Benchmark(HumanEval 与 MBPP)中,CodeShell 取得同等规模最好的性能。

本次开源的模型如下:

  • CodeShell Base:CodelShell 底座模型,具有强大的代码基础能力。

  • CodeShell Chat:CodelShell 对话模型,在代码问答、代码补全等下游任务重性能优异。

  • CodeShell Chat 4bit:CodelShell 对话模型 4bit 量化版本,在保证模型性能的前提下内存消耗更小,速度更快。

  • CodeShell CPP:CodelShell 对话模型 CPP 版本,支持开发者在没有 GPU 的个人电脑中使用。注意,CPP 版本同样支持量化操作,用户可以在最小内存为 8G 的个人电脑中运行 CodeShell。


下图是 CodeShell 代码助手的 VS Code 插件截图:

IDEA 插件:

往期推荐



有奖问答 | 大数据时代下机器学习的新范式
美国政府限制向中国出口NVIDIA H800 GPU
大神用Scratch手搓RISC-V模拟器,成功运行Linux内核




这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GPT-4写代码不如ChatGPT,误用率高达62%!加州大学两位华人开源代码可靠性基准RobustAPIUC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源【模板】Cell:提供了解释“脑雾”的关键证据,系5-羟色胺水平显著降低;百忧解会是潜在的治疗药物吗?Java 近期新闻:JDK 22 的 JEP、Spring Shell、Quarkus、Apache Camel、JDKMon飞去参观比萨斜塔ChatGPT代码生成飙升10%!北大华人一作:细化prompt,大幅改进大模型代码能力李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型回乡散记 四免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!平替XShell,分享一款功能强大、跨平台、免费的 SSH 客户端:PortXImmunity | 清华大学药学院张从刚课题组报道新型cGAMP降解酶和新型cGAS-STING通路小分子抑制剂Java 21:下一个LTS版本,提供了虚拟线程、记录模式和模式匹配卧槽!红警源代码居然开源了....国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B无题Java远程热部署插件 - 吊打市面插件人手一个编程助手!北大最强代码大模型CodeShell-7B开源,性能霸榜,IDE插件全开源我们真的需要另一种非开源的源代码可用许可证吗? | Linux 中国UC伯克利等发布多模态基础模型CoDi-2;谷歌DeepMind利用AI工具发现200万种新材料丨AIGC日报中国式非自愿单身:认识 incel,理解 incel,成为 incel只有我和卖香蕉的和世界对着干终于来了:Windows 11深夜大更新,大模型Copilot全覆盖Office北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型硬核观察 #1174 OpenELA 发布用于构建 RHEL 8/9 衍生版的源代码逼近GPT-4,AI编程要革命!Meta开源史上最强代码工具Code Llama阿里云中标9亿AI算力大单;浙大校友开源LLaVA-1.5多模态大模型;Meta因开源模型遭抗议丨AIGC大事日报UOS 将推 Rust 版 Bash 命令行工具utshell,支持防篡改、防溢出小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大AlmaLinux 正开发成为不包含 RHEL 代码但兼容 RHEL 的发行版本至今已发13篇Nature/Science/Cell,施一公学生李晓淳再发Cell一次通过率73%,开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型专注图表理解,腾讯、南洋理工等开源图表羊驼大模型ChartLlamaCell | 发现糖尿病的新病因,为治疗这种疾病的新型药物提供了潜在的治疗靶标两棵梨树大模型写代码能力突飞猛进,北大团队提出结构化思维链SCoT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。