Redian新闻
>
Stability AI宣布推出新的开源大型语言模型

Stability AI宣布推出新的开源大型语言模型

公众号新闻

点击蓝字 关注我们

SUBSCRIBE to US


Illustration by Alex Castro / The Verge


人工智能驱动的稳定扩散图像生成器背后的Stability AI公司发布了一套开源大型语言模型(LLM),统称为StableLM。在近日分享的一篇帖子中,该公司宣布其模型现在可供开发人员在GitHub上使用和调整。


Here’s an example of what StableLM can do. Image: Stability AI


与ChatGPT的竞争对手一样,StableLM旨在高效地生成文本和代码。它是在一个更大版本的开源数据集Pile上训练的,该数据集包含来自一系列来源的信息,包括维基百科、Stack Exchange和PubMed。StabilityAI表示,StableLM模型目前有30亿至70亿个参数可用,稍后还会推出介于150亿至650亿参数的模型。


虽然StableLM扩展了Stability AI已经与非营利组织EleutherAI合作开发的开源语言模型,但它也建立在使人工智能工具更易于访问的使命之上,就像它在Stable Diffusion中所做的那样。该公司以多种方式提供了文本到图像的人工智能,包括公开演示、软件测试版和模型的完整下载,使开发人员可以使用该工具并进行各种集成。


Stability AI’s “fine-tuned” chat model is a work in progress. Screenshot: Emma Roth / The Verge


你可以在Hugging Face上试用StableLM经过微调的聊天模式的演示,当我试着问它如何制作花生酱三明治时,它给了我一个非常复杂且有点荒谬的食谱。Stability AI 提醒,它使用的海量数据应该有助于引导基础语言模型转换为更安全的文件,但并非所有问题都可以透过微调来解决。


微信号|IEEE电气电子工程师

新浪微博|IEEE中国

 · IEEE电气电子工程师学会 · 


神奇的混合忆阻器AI芯片可扩展

芝加哥大学研究无需硬件即实现手指触觉感知

北航学生设计的微型机器人 能够弹跳自身长度的87倍

10张图总结2023年人工智能状况

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大型语言模型(LLM)的潜力有多大?银行业专用大型语言模型落地大型语言模型综述全新出炉:从T5到GPT-4最全盘点,国内20余位研究者联合撰写大型语言模型与知识图谱协同研究综述:两大技术优势互补Pienso为企业提供由云上IPU支持的高效大型语言模型访问Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!大型语言模型也能跑在浏览器上了!又一ChatGPT平替诞生,训练成本8.5万美元关于大型语言模型的争论和局限表现优于 GPT-4,ChemCrow 集成 13 种化学工具,增强大型语言模型的化学性能褪黑素能预防睡眠不足导致的记忆缺陷;大型语言模型综述全新出炉:从T5到GPT-4最全盘点|本周论文推荐北京内推 | 阿里达摩院招聘大型语言模型(LLM)应用方向实习生基于重排序的新量化方法RPTQ:实现大型语言模型的 3 比特量化素食好主意 【荷塘小炒】周五云讲堂 | 王子涵:大型语言模型及其应用晨骑, FTP booster解密大型语言模型:从相关性中发现因果关系?如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍腥风血雨里的南明短命王朝(八)讲座预告 | 软件工程学院博学论坛第十五期:自然语言处理与大型语言模型的挑战与探索邀请您参加IEEE网络技术论坛:基于大型语言模型的组合推理大型语言模型综述全新出炉!从T5到GPT-4最全盘点,国内20余位研究者联合撰写百篇论文纵览大型语言模型最新研究进展Stable Diffusion背后公司开源大语言模型,很火,但很烂大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools最新综述!当大型语言模型(LLM)遇上知识图谱:两大技术优势互补生活且惜且前行GPT-4要来了!一文看尽大型语言模型的过去、现在、未来Stability AI发布语言模型StableLM,能力不及ChatGPT,但胜在开源大型语言模型的推理演算有证据了,MIT表明:大型语言模型≠随机鹦鹉,确实能学到语义ACL 2023长文 | 先计划再求解:提升大型语言模型的零样本链式推理InfoQ 2023 年趋势报告:影响组织文化的两个最大的因素是大裁员和 ChatGPT 等大型语言模型中文医学大模型“本草”(原名华驼):医学知识增强在中文大型语言模型指令微调上的初步探索【保姆级】深入解析大型语言模型核心技术关小黑屋的心得。。。
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。