Redian新闻
>
大羊驼LLaMa竞品来了:AI画图最火公司开源语言模型,最小30亿参数

大羊驼LLaMa竞品来了:AI画图最火公司开源语言模型,最小30亿参数

公众号新闻

机器之心报道

编辑:泽南
直接开源,随便试用。

出 Stable Diffusion 的公司也出语言大模型了,效果还挺好。本周三,StableLM 的发布引来了科技圈的关注。


Stability AI 是近期势头正盛的创业公司,因为开源的 AI 画图工具 Stable Diffusion 而饱受好评。在周三的发布中,该公司宣布其语言大模型现已可供开发人员在 GitHub 上使用和改编。


与业内标杆 ChatGPT 一样,StableLM 旨在高效地生成文本和代码。它在名为 Pile 的开源数据集的更大版本上进行训练,其中包含来自各种来源的信息,包括维基百科、Stack Exchange 和 PubMed,共 22 个数据集,容量达到 825GB,1.5 万亿个 token。


Stability AI 表示,StableLM 模型目前可用版本的参数在 30 亿到 70 亿之间,未来将有 15 亿到 650 亿范围的多种参数模型可用。


项目链接:https://github.com/stability-AI/stableLM/


根据目前人们的测试,如果跑 7B 模型(8 bit),需要用到 12GB 的显存。


Stability AI 也放出了一些 StableLM 的问答示例:


StableLM 基于 Stability AI 此前与非营利组织 EleutherAI 合作开发的开源语言模型,包括 GPT-J、GPT-NeoX 和 Pythia,新模型面向尽可能大的用户群。此前在 Stable Diffusion 上,Stability AI 通过多种方式提供其文本到图像 AI 的技术,包括公开演示、软件测试版和模型的完整下载,也允许开发人员使用其工具并进行各种集成。


相比 OpenAI 的封闭,Stability AI 一直把自身定位为 AI 研究社区的一员,我们大概率会在 StableLM 上看到和上月发布的 Meta 开源 LLaMa 语言模型同样的情况。大量基于原版模型的算法可能会出现,在较小模型体量之上实现很好的效果。


StableLM 的微调版聊天界面。

此外,现在每个人都可以尝试在 Hugging Face 上托管的 StableLM 微调聊天模型上和 AI 进行对话:https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat


和所有语言大模型一样,StableLM 模型仍然存在「幻觉」问题,如果你尝试问它如何制作花生酱三明治,StableLM 会给出一个非常复杂且荒谬的食谱。它还建议人们在慰问卡上添加一张「有趣的图画」。


Stability AI 警告说,虽然它使用的数据集应该有助于「将基础语言模型引导到『更安全』的文本分布中,但并不是所有的偏见和毒性都可以通过微调来减轻。


现在 StableLM 模型已在 GitHub 存储库中上线。Stability AI 表示将在不久的将来发布一份完整的技术报告,此外还将启动众包 RLHF 计划,并与 Open Assistant 等社区合作,为 AI 聊天助手创建一个开源数据集。


参考内容:

https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models

https://www.theverge.com/2023/4/19/23689883/stability-ai-open-source-large-language-model-stablelm


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此300美元平替ChatGPT!斯坦福130亿参数「小羊驼」诞生,暴杀「草泥马」Meta最新语言模型LLaMA论文研读:小参数+大数据的开放、高效基础语言模型阅读笔记叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能再胜OpenAI!谷歌发布20亿参数通用模型,100多种语言自动识别翻译彭博推出BloombergGPT——专为金融行业从头打造的500亿参数大语言模型参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数震惊!超级大佬突然遇刺身亡!利空骤现,这家银行惊现250亿空单!全球最火公司出手斯坦福70亿参数开源模型媲美GPT-3.5,100美元即可复现单个GPU就能跑!UC伯克利领头,130亿参数「小羊驼」权重公布宾州新希望小城(New Hope),街头扫描300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了葡萄牙圣维森特德福拉修道院,17世纪建筑LeCun转赞:在苹果M1/M2芯片上跑LLaMA!130亿参数模型仅需4GB内存国产乾元2大模型来了:可编程金融文生图,120亿参数,超对称联手复旦出品Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMAStable Diffusion背后公司开源大语言模型,很火,但很烂我在iPhone上装了70亿参数大模型,来自陈天奇团队最新成果ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型豪斯曼:《诗歌外编》: 第十五首:已经五年了,“到了尽头,”我说击败OpenAI!谷歌公布20亿参数通用语音模型,支持100+语种检测翻译自然感染新冠免疫力究竟如何呢?LeCun狂赞:600刀GPT-3.5平替! 斯坦福70亿参数「羊驼」爆火,LLaMA杀疯了又一国产大模型来了,超对称联合复旦大学发布 120 亿参数语言模型 BBT-2, 已开源lāo dao?láo dao!谷歌没开源的PaLM,网友给开源了!千亿参数微缩版:最大只有10亿,8k上下文熔岩羊驼LLaVA来了:像GPT-4一样可以看图聊天,无需邀请码,在线可玩刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此苦难与依托ChatGPT 开源平替来了,开箱即用!200 亿参数,采用 4300 万条指令集微调模型从LLM到MLLM,多模态大规模语言模型KOSMOS-1赋予了语言模型看见世界的能力NLP大规模语言模型推理实战:大语言模型BLOOM推理工具测试实践与效果分析实录AI绘画新思路:国产开源50亿参数新模型,合成可控性、质量实现飞跃
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。