Redian新闻
>
Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token

且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行

性能方面,Stable Code 3B规模比CodeLLaMA 7B小60%,但性能却大差不差。

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

效果非常好!体积小,兼容各种硬件且运行速度非常快。

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补(FIM)等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token。

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

支持以下18种编程语言:

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7B,Stable Code 3B的性能也差不多能与其打个平手,在Python、CPP语言上甚至略胜一筹。


在类似大小的模型中,Stable Code 3B表现突出。

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为“没有太多新东西”、“没有那么好”。

此外,它仅支持英语和编程语言,也是让大家有些许失望。


对此,你怎么看?

参考链接:
[1]https://huggingface.co/stabilityai/stable-code-3b

[2]https://twitter.com/StabilityAI/status/1747348018884493623

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好2023年收入最高的10种编程语言苹果开源Pkl——用于生成配置的编程语言Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑为什么说 Rust 是编程语言界的原神 | 极客时间视觉模型+大语言模型:首个支持10K+帧长视频理解任务的新型框架《歌德堡变奏曲1465》隐退三年重出山!身价4800亿的谷歌创始人亲自给Gemini写代码,经常加班到凌晨LeCun引战,LLM根本不会推理!大模型「涌现」,终究离不开上下文学习这样写代码,同事乐开花一文速览NeurIPS 2023大模型/预训练/上下文学习相关Spotlight文章双林奇案录第三部之鹤鼎莲方壶: 第九节ChatGPT被曝“重复漏洞”;华为云推出首个大模型混合云;传Stability AI投资者要求CEO辞职丨AIGC大事日报苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型Redis 之父自曝用 AI 写代码,锐评:LLM 有望取代 99% 的程序员!动物革命和外星人的降临无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4【五律】邻居花猫在后院树下戏弄小松鼯五分钟原形毕露200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!一句话解锁100k+上下文大模型真实力,27分涨到98,GPT-4、Claude2.1适用AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的模型上下文长度达到10000000,又一批创业者完蛋了?JetBrains发布2023开发者报告!35岁危机存在吗?谁是最好的编程语言?【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型趣图:自己单独写代码 vs 有人看着写代码【有请入内投票】开箱笔记本的汇总(点名开箱笔记本直接留言即可)面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug听和看习主席在加尼福利亚政商欢迎宴会上致辞消息称三星 Galaxy Book 4 系列笔记本 12 月 15 日发布,有望支持本地运行高斯 AI 大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。