Redian新闻
>
Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑

公众号新闻
西风 发自 凹非寺
量子位 | 公众号 QbitAI

Stability AI开年第一个大模型来了!

名为Stable Code 3B,参数27亿,专为写代码而生。

Stable Code 3B可理解处理18种不同的编程语言,上下文长度100K token

且它对硬件要求也不高,用MacBook Air等普通笔记本电脑也能离线运行

性能方面,Stable Code 3B规模比CodeLLaMA 7B小60%,但性能却大差不差。

BigCode评估中,在包含多种编程语言的MultiPL-E数据集上,Stable Code 3B与类似大小的模型相比,都拿下了SOTA性能。

Stable Code 3B刚上线,有网友反馈已经在插件中用上了:

效果非常好!体积小,兼容各种硬件且运行速度非常快。

Stable Code 3B长啥样?

在此之前,Stability AI去年8月份就已发布了一个初代版本Stable Code Alpha 3B,Stable Code 3B是其进化版。但开发团队表示,Stable Code 3B是首个主要版本,基于Stable LM 3B基础模型打造,并增加了多项附加功能。

其中就包括支持中间填补(FIM)等新功能,并使用RoPE(旋转位置嵌入)方法,将上下文长度从16000 token拉长至100000 token。

Stable Code 3B整体架构类似于LLaMA,是一个仅解码器模型,使用Flash Attention 2算法。

支持以下18种编程语言:

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

下面是对性能比较的补充。

面对比自己大两倍多的CodeLLama 7B,Stable Code 3B的性能也差不多能与其打个平手,在Python、CPP语言上甚至略胜一筹。


在类似大小的模型中,Stable Code 3B表现突出。

不过也有吐槽声

虽然Stable Code 3B收到了一波好评,但也有不少网友认为“没有太多新东西”、“没有那么好”。

此外,它仅支持英语和编程语言,也是让大家有些许失望。


对此,你怎么看?

参考链接:
[1]https://huggingface.co/stabilityai/stable-code-3b

[2]https://twitter.com/StabilityAI/status/1747348018884493623

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
隐退三年重出山!身价4800亿的谷歌创始人亲自给Gemini写代码,经常加班到凌晨200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了Go 编程语言 - 你应该知道的一切【五律】邻居花猫在后院树下戏弄小松鼯五分钟原形毕露ChatGPT被曝“重复漏洞”;华为云推出首个大模型混合云;传Stability AI投资者要求CEO辞职丨AIGC大事日报苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用一文速览NeurIPS 2023大模型/预训练/上下文学习相关Spotlight文章为什么说 Rust 是编程语言界的原神 | 极客时间无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务2023年收入最高的10种编程语言视觉模型+大语言模型:首个支持10K+帧长视频理解任务的新型框架720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑这样写代码,同事乐开花趣图:自己单独写代码 vs 有人看着写代码动物革命和外星人的降临模型上下文长度达到10000000,又一批创业者完蛋了?LeCun引战,LLM根本不会推理!大模型「涌现」,终究离不开上下文学习Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑苹果开源Pkl——用于生成配置的编程语言谷歌AI大模型Gemini亮相:擅长复杂学科推理,能懂编程语言 PK GPT-4Pascal之父去世!图灵奖得主、编程语言泰斗Niklaus Wirth享年89岁Redis 之父自曝用 AI 写代码,锐评:LLM 有望取代 99% 的程序员!JetBrains发布2023开发者报告!35岁危机存在吗?谁是最好的编程语言?AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug陶哲轩看了都直呼内行!谷歌等用LLM自动证明定理拿顶会杰出论文,上下文越全证得越好一句话解锁100k+上下文大模型真实力,27分涨到98,GPT-4、Claude2.1适用GPT-4劲敌Claude 3来了,上下文和多模态显著提升:OpenAI是可被超越的【有请入内投票】开箱笔记本的汇总(点名开箱笔记本直接留言即可)《歌德堡变奏曲1465》听和看习主席在加尼福利亚政商欢迎宴会上致辞双林奇案录第三部之鹤鼎莲方壶: 第九节
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。