Redian新闻
>
开源版ChatGPT要来了?这个AI做图神器团队,想让人人都能做自己的大模型

开源版ChatGPT要来了?这个AI做图神器团队,想让人人都能做自己的大模型

科技

由 Stability.ai 发布的开源模型 Stable Diffusion 可以说是目前最主流也是最重要的 AI 绘画模型之一。
基于开源的 Stable Diffusion,开发者社区创作了许多有意思的插件和模型,例如可以控制图形形状的 Control Net 项目等,相关的开发项目超过 1000 个。
现在,这家热衷于开源的 AI 公司又想搞一个大事情——发布一个类似 ChatGPT 的开源大语言模型。
人人都有 LLM
2023 年可以说大语言模型井喷的一年,这几个月以来,几乎每个星期都有一个新的大语言模型面试。大模型、小模型、文本生成的、多模态的、闭源的、开源的……现在就是大语言模型的春天,各家百花齐放。
这份热闹不仅属于微软、Google、百度、阿里等互联网大厂,也属于所有与 AI 相关的科技公司。
和现有的大模型相比,Stability.ai 发布的 StableLM 大语言模型有什么特别的呢?
根据 Stability.ai 的介绍,目前 StableLM 是一个开源且透明的模型,允许研究人员和开发者自由地检查、使用和修改代码。就像 Stable Diffusion 一样,用户们都可以自由地配置 Stable LM,打造专为自己需求而量身定制的大语言模型。
目前 Stable LM Alpha 版本模型的参数大小为 30 亿和 70 亿,未来 Stability.ai 还会提供 150 亿和 650 亿参数大小的模型版本。
尽管和 GPT-3 模型的 1750 亿参数相比,StableLM 的模型大小要小得多,但 Stability.ai 表示 StableLM 是基于一个比 The Pile 数据集还要大 3 倍的扩展数据集训练而成,在编码和自然语言对话方面都有不错的表现。
The Pile 数据集本身已经包括了大量书籍、Github 知识库、网页、聊天记录等数据,还收集了医学、物理、数学、计算机科学和哲学学科的论文,可以为通用大语言模型、跨领域文本生成训练提供很好的基准。
因此在实际使用时,StableLM 与 GPT-3 的差距并不像纸面参数数据的差异那样明显。
Stability.ai 在公告中展示了 StableLM 处理三个不同任务的实际表现,包括写邮件、写 Rap 歌词(问题:写一首深度学习网络与符号人工智能互呛的史诗级 Battle 歌词。只能说这极客味太重了)和写代码。
Stability.ai 还把 StableLM 托管在了 HuggingFace 的社区网站上,想抢先体验的朋友可以到一下地址调戏它⬇️
🔗 https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat

从我们做的简短测试来看,StableLM 的中文水平还不如郭杰瑞,更不用说和 ChatGPT 这样的优等生对比,因此在对话时尽量使用选择英语。
开源还是闭源之争
和包括斯坦福大学的 Alpaca 在内的众多开源大语言模型一样,StableLM 给了很多开发者在本地或者服务器亲手定制大语言模型的机会,不用再担心你的数据泄漏给了模型后台。

ChatGPT 爆火后,关于 AI 模型的数据隐私问题层出不穷,前不久三星还被爆出有多名员工向 ChatGPT 泄漏机密数据的事件,以致三星的半导体部门决定自己开发内部 AI 工具,避免类似的问题再次发生。
开源模型除了有高透明度的优势,开发者们也更容易利用开源模型开发出更具有创造力的应用。例如你可以对 StableLM 做定制化的调试,让它变成一个不会停歇的网文作家,或者是非常熟悉公司项目的资深程序员或文案写手,甚至可以调试成微博上的星座运程大师。
开源模型给了开发者更大的想象力空间,但与此同时,也会给作恶者更先进的手段。
对别有用心者来说,开源大语言模型可能就是做电信诈骗的神器,他们可以逼真的对话把人们骗的团团转。
开源总是会伴随争议,这一点 Stability.ai 早有预料。此前因为开源 Stable Diffusion,Stability.ai 已经遭到了许多涉嫌侵犯艺术家权利的法律诉讼,以及因用户使用其工具生成色情内容而引起的争议。
Stability.ai 的 CEO Emad Mostaque 在此前的采访中提到,大模型需要接受更多监督,而不是被大公司锁在小黑盒里,因此大模型的社区开放性也非常重要。Stability.ai 坚持开源,是想把技术带给更多的人,引发人们的思考。
StableLM 是对 Stability.ai 的承诺的又一验证,一个人人都有专属语言模型的未来或许就此展开。


点击「在看

是对我们最大的鼓励

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐怖,机器人都能用,学术圈已刷屏Meta版ChatGPT惨遭“开源”?最新大模型LLaMA被泄露,已在GitHub收获7k+星2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载微软开源DeepSpeed Chat,人人可快速训练百亿、千亿级ChatGPT大模型解决通用LLM「偏科」问题,数学大模型MathGPT要来了!【雨水】心雨细无声· 写在老爸“七七”之日叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能重磅!华为版ChatGPT,要来了!草书《兰亭序》“中央公园五人”冤狱事件,那是川普对美国的第一次尖叫这是Meta版ChatGPT雏形?开源、一块GPU就能跑,1/10参数量打败GPT-3【周末得吃好的】卤牛腱+芝麻烧饼+酸辣汤+杏仁蛋糕通用视觉GPT之战打响!智源推出SegGPT,批量抠图神器来了开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT实测最像ChatGPT的中文产品:能解释三体、懂弱智吧的梗,内测开启人人都能试!Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMAChatGPT“爆火”之后,medGPT要来了!LLaMA模型惨遭泄漏,Meta版ChatGPT被迫「开源」!GitHub斩获8k星,评测大量出炉开源版ChatGPT来了?多数任务效果超越GPT3,已开源!又一大模型惨遭泄漏,Meta版ChatGPT被迫开源!巴黎市长将重修Châtelet 广场以方便行人开源版ChatGPT,30分钟训完,性能堪比GPT3.5!IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-440年难遇GPT时代?大模型API集体开放,人人都能抓住的编程新风口!| 极客时间对话元语智能创始团队:做中国版ChatGPT,为什么坚持大模型开源路线?|甲子光年商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools人人都能懂的ChatGPT解读【城事】巴黎市长将重修Châtelet 广场以方便行人跑分达ChatGPT的99%,人类难以分辨!开源「原驼」爆火,iPhone都能微调大模型了ChatGPT要怎么微调?MIT韩松团队新作告诉你!讯飞星火大模型抢先进入​「升级战」:中国版ChatGPT来了大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型冬季周末的一大享受
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。