Redian新闻
>
160亿参数,新增多项能力,复旦MOSS开源了

160亿参数,新增多项能力,复旦MOSS开源了

公众号新闻

机器之心报道

编辑:蛋酱


今年 2 月份,机器之心报道了复旦大学推出中国版 ChatGPT 的消息(参见《复旦发布中国版 ChatGPT:MOSS 开启测试冲上热搜,服务器挤爆》),引起了广泛关注。当时,邱锡鹏教授就曾表示将于四月份开源 Moss。


昨天,开源版的 Moss 真的来了。


项目地址:https://github.com/OpenLMLab/MOSS


MOSS 是一个支持中英双语和多种插件的开源对话语言模型,但参数数量比 ChatGPT 少得多。在 v0.0.2 之后,团队持续对其进行调整,推出了 MOSS v0.0.3,也就是目前开源的版本。相比于早期版本,功能也实现了多项更新。


最初的测试中,MOSS 的基础功能与 ChatGPT 类似,可以按照用户输入的指令完成各类自然语言处理任务,包括文本生成、文本摘要、翻译、代码生成、闲聊等等。


开放内测后,团队继续加大中文语料的预训练:「截止目前,MOSS 003 的基座语言模型已经在 100B 中文 token 上进行了训练,总训练 token 数量达到 700B,其中还包含约 300B 代码。」


在开放内测后,我们也收集了一些用户数据,我们发现真实中文世界的用户意图和 OpenAI InstructGPT 论文中披露的 user prompt 分布有较大差异(这不仅与用户来自的国家差异有关,也跟产品上线时间有关,早期产品采集的数据中存在大量对抗性和测试性输入),于是我们以这部分真实数据作为 seed 重新生成了约 110 万常规对话数据,涵盖更细粒度的 helpfulness 数据和更广泛的 harmlessness 数据。

内容来源:https://www.zhihu.com/question/596908242/answer/2994534005

目前,团队已将 moss-moon-003-base、moss-moon-003-sft、moss-moon-003-sft-plugin 三个模型上传到 HuggingFace。后续,还有三个模型将会开源。


根据项目主页介绍,moss-moon 系列模型具有 160 亿参数,在 FP16 精度下可在单张 A100/A800 或两张 3090 显卡运行,在 INT4/8 精度下可在单张 3090 显卡运行。


团队同时表示,由于模型参数量较小和自回归生成范式,MOSS 仍然可能生成包含事实性错误的误导性回复或包含偏见 / 歧视的有害内容,请谨慎鉴别和使用 MOSS 生成的内容,请勿将 MOSS 生成的有害内容传播至互联网。


新增能力


在 MOSS v0.0.3 中,团队加入了多项新能力。


团队构造了约 30 万插件增强的对话数据,包含搜索引擎、文生图、计算器、方程求解等。关于插件版 MOSS 如何使用,后续团队将在 GitHub 公布。


MOSS v0.0.3 现已引入使用多种插件的能力。


下图展示了调用搜索引擎的能力:



下图展示了调用方程求解器的能力:



下图展示了从文本生成图片的能力:


项目作者孙天祥补充说,MOSS 003 支持启用插件的能力是通过 meta instruction 来控制,类似 gpt-3.5-turbo 里的 system prompt。「因为是模型控制的,所以并不能保证 100% 控制率,以及还存在一些多选插件时调用不准、插件互相打架的缺陷,我们正在尽快开发新的模型来缓解这些问题。」


下载安装


下载本仓库内容至本地 / 远程服务器:

git clone https://github.com/OpenLMLab/MOSS.gitcd MOSS

创建 conda 环境:


conda create --name moss python=3.8conda activate moss

安装依赖:


pip install -r requirements.txt


其中 torch 和 transformers 版本不建议低于推荐版本。


根据协议,开源的 MOSS 可用于商业用途:



此外,开发者也可通过 API 调用 MOSS 服务,团队将根据当前服务压力考虑通过 API 接口形式提供服务,接口格式可参考:https://github.com/OpenLMLab/MOSS/blob/main/moss_api.pdf


目前,已有开发者根据开源内容进行而创,比如通过 VideoChat 进行视频问答。


VideoChat 是一款多功能视频问答工具,结合了动作识别、视觉字幕和 StableLM 的功能。该工具可为视频中的任何对象和动作生成密集的描述性字幕,提供一系列语言风格以满足不同的用户偏好。它支持用户进行不同长度、情绪、语言真实性的对话。


项目地址:https://github.com/OpenGVLab/Ask-Anything/tree/main/video_chat_with_MOSS



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中国版ChatGPT「MOSS」服务器被挤爆,复旦团队致歉:还不成熟650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了8点1氪:复旦MOSS团队回应内测国内首个类ChatGPT模型;全球第5例艾滋病治愈者出现;10省份放宽公务员年龄限制至40周岁初代iPhone拍出6.3万美元天价;复旦MOSS被挤爆,团队致歉;法拉第未来将在4月底向首批用户交付丨邦早报ChatGPT 又遇劲敌!谷歌发布史上最大 AI 模型 PaLM-E:5620 亿参数,无需特殊训练即可操纵机器人参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数黑与光的对话 | 法国皮埃尔·苏拉热的黑色油画碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face让女人难以抗拒的爱情宣言又一国产大模型来了,超对称联合复旦大学发布 120 亿参数语言模型 BBT-2, 已开源复旦大学 MOSS 大模型正式开源;周鸿祎:360 员工不会被 GPT 淘汰;Google 重组 AI 研究部门|极客早知道一万亿参数,512个昇腾910训练,华为PanGu-Σ大模型来了大羊驼LLaMa竞品来了:AI画图最火公司开源语言模型,最小30亿参数复旦新作:单机微调650亿参数大模型;蚂蚁、百度参投AI大模型创企;杭州检方对AI换脸案提起公诉丨AIGC大事日报谷歌没开源的PaLM,网友给开源了!千亿参数微缩版:最大只有10亿,8k上下文金融GPT来了:500亿参数,但用来投资还是跑不赢大盘ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型怎么开始学佛(八)六根,六尘,六识ChatGPT 开源平替来了,开箱即用!200 亿参数,采用 4300 万条指令集微调模型AI绘画新思路:国产开源50亿参数新模型,合成可控性、质量实现飞跃5620亿参数,最大多模态模型控制机器人,谷歌把具身智能玩出新高度ZT:中医看病的基本思路复旦MOSS大模型开源了!Github和Hugging Face同时上线喜报|海创生物获千万级Pre-A融资、复旦MOSS团队回应内测:没想到引起这么大关注复旦MOSS升级版开源上线;马斯克启动TruthGPT;海康训练出百亿参数CV大模型丨AIGC大事周报今年与国内家人团聚 能不能成行?国产乾元2大模型来了:可编程金融文生图,120亿参数,超对称联手复旦出品DriveGPT自动驾驶大模型中国玩家首发!1200亿参数,毫末智行出品CV开启大模型时代!谷歌发布史上最大ViT:220亿参数,视觉感知力直逼人类斯坦福70亿参数开源模型媲美GPT-3.5,100美元即可复现终结者最强大脑!谷歌发布史上最大「通才」模型PaLM-E,5620亿参数,看图说话还能操控机器人只有掌握这项能力,企业才能持续创新增长复旦发布中国版ChatGPT:MOSS开启测试冲上热搜,服务器挤爆300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。