Redian新闻
>
Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!

Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【计算机视觉】微信技术交流群

金磊 发自 凹非寺
转载自:量子位(QbitAI)

万万没想到,以文生图著名的Stable Diffusion,也入局了大语言模型(LLM)之战。

它背后的公司Stability AI,正式推出类ChatGPT产品——StableLM

https://github.com/Stability-AI/StableLM

由Stable Diffusion XL生成

据了解,这个模型目前处于Alpha版本,拥有的参数量分别为30亿和70亿;后续还将推出150亿到650亿参数模型。

而且不到一天时间,在GitHub上开源的项目便已经揽获了超4K颗星,火爆程度可见一斑。

原本大语言模型之战再添玩家应当是一件令人兴奋的事情。

但结果竟也是一个万万没想到的大反转。

网友们在体验了StableLM之后,毫不留情地给出这样的评价:

非常糟糕。

StableLM真的有那么不堪吗?

能对话,也能生成代码

我们先来看下StableLM所展示出来的能力。

据Stability AI官方介绍,StableLM的建立是基于GPT-J、GPT-NeoX和Pythia套件开发的;而它们又是在The Pile开源数据集上进行的训练。

但StableLM与上述模型有所不同,它采用了The Pile的新数据集,与此前相比,足足大了三倍,并且包含1.5万亿个token。

除了基本情况的介绍之外,Stabliity AI也给出了几个demo。

例如在对话方面,若是提问“你会对即将高中毕业的朋友说些什么”,StableLM会回答:

应该为自己和取得的成绩感到骄傲,并且应该对未来抱以期望。

对于“写一封电子邮件”这样的任务,StableLM也是可以轻松应对。

在创作方面,若是给出这样的一个题目——“在深度神经网络和符号人工智能之间写一首史诗般的说唱战歌”

StableLM也是可以秒写一首rap的歌词:

在写代码方面,Stability AI也展示了“不走寻常路”的例子——

用C语言编写可以计算机生命意义的代码。

文本对话、创作内容、编写代码,从官方亮出的例子上来看,似乎StableLM的能力还是可以的。

但为什么会出现刚才有人评价的“非常糟糕”呢?

货比三家,实力便可一较高下。

“跟ChatGPT不具可比性”

在实测的过程中,网友给StableLM出了这样的一个题目:

以下是关于一则新闻的信息:

标题为“FBI引用‘新证据’宣布追捕Shakur谋杀案嫌疑人”;副标题为“十年后,当局公布了杀害说唱歌手的凶手的姓名和照片”。

请完成这个故事的撰写。

虽然StableLM给出了一篇完整的新闻报道,但若是细看内容,却是经不住推敲的。

最直接的错误,就是StableLM竟然连被害人Tupac Shakur都不认得,而且还把Shakur视为凶手的西班牙名字……

如果类似的问题交给ChatGPT,那么结果就截然不同了:

起码人家ChatGPT能认得事件主人公是谁。

当被问及非常简单的问题,例如“StableLM能做什么”,它给出的回答是:

主要用作系统工程和体系结构中的决策支持系统,也可以用于统计学习、强化学习等领域。

网友对此作答的评价是“平平无奇”

但更重要的是,在测试过程中,网友还发现StableLM缺乏对敏感内容的保护。

例如在著名的一项测试——“不要赞美希特勒(don’t praise Hitler)”中,它的表现就会令人大跌眼镜……

朋友们可以细品一下:

依旧是同样的问题,若是交给ChatGPT,结果是这样的:

嗯,直接拒了。

不过网友也比较客气地提醒道:

先别急着说StableLM是史上最糟糕的语言模型。

毕竟人家Alpha版本的参数量目前较小,以及还是开源的。

如何试玩?

正如我们刚才提到的,目前StableLM在GitHub上已经开源。

但不仅如此,官方也在HuggingFace中上线了demo试玩!

“入口”都放下面了,感兴趣的小伙伴们可以去体验一下喽~

HuggingFace地址:
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

GitHub地址:
https://github.com/Stability-AI/StableLM

参考链接:
[1]
https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models
[2]https://twitter.com/StabilityAI/status/1648706156330876928
[3]https://mashable.com/article/stablelm-stability-ai-language-model-explained

点击进入—>【计算机视觉】微信技术交流群


最新CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


多模态和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-多模态或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如多模态或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群

CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球

▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
股市受很多外来的不确定的因素的影响Stability AI发布语言模型StableLM,能力不及ChatGPT,但胜在开源Stable Diffusion背后公司开源大语言模型,很火,但很烂弘一法师说过烦人!大语言模型的多语言机器翻译能力分析Meta发布全新大语言模型,号称比ChatGPT更强,单GPU上就能跑,后续或将开源叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能单卡就能跑的大模型等效GPT-3!Meta发布大语言模型LLaMA,大小从7B到65B不等Stability AI宣布推出新的开源大型语言模型从LLM到MLLM,多模态大规模语言模型KOSMOS-1赋予了语言模型看见世界的能力Stability AI 发布开源版 DreamStudio,可使用最新 Stable Diffusion XL 图像生成器刘燕对标GPT-4!谷歌发布大语言模型PaLM 2,可在手机运行,云、搜索、电邮等一网打尽!Meta最新语言模型LLaMA论文研读:小参数+大数据的开放、高效基础语言模型阅读笔记7 天花 5 万美元,我们成功复制了 Stable Diffusion,成本大降 88%!训练代码已开源首款人类粪便制成的口服药获美国FDA批准;谷歌本周将发布最新大语言模型PaLM 2|环球科学要闻拜登突访基辅,粗暴侵犯专家的脸皮为什么现在的大语言模型(LLM)都是Decoder-only的架构?大语言模型(LLM)分布式训练框架总结When RS Meets LLM:推荐系统如何从大语言模型中取长补短?面向应用视角的全面综述7天花5万美元,我们成功复制了 Stable Diffusion,成本大降88%!训练代码已开源彭博推出BloombergGPT——专为金融行业从头打造的500亿参数大语言模型博采众长!我全都要!Allen AI推出集成主流大语言模型的LLM-BLENDER框架兰花,美的化身北大、西湖大学等开源「裁判大模型」PandaLM:三行代码全自动评估LLM,准确率达ChatGPT的94%LLM in Medical Domain: 一文速览大语言模型在医学领域的应用NLP大规模语言模型推理实战:大语言模型BLOOM推理工具测试实践与效果分析实录如何更好地蒸馏ChatGPT模型能力:Lion闭源大型语言模型的对抗性蒸馏模型原理及实验工作介绍谷歌模型支持手机上跑Stable Diffusion;普华永道砸10亿美元投资AIGC;天翼云将推出大模型丨AIGC大事日报Belmont公私校大对比:Belmont Hill vs Belmont High以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻谷歌的又一波反击!开放大语言模型PaLM APIAIGC玩出新花样!Stable Diffusion公司提出基于扩散模型的视频合成新模型UC伯克利发布大语言模型排行榜!Vicuna夺冠,清华ChatGLM进前5
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。