Redian新闻
>
复旦 “ 首发 ” 国产版 ChatGPT!名为 MOSS 惹群嘲,回应称:还非常不成熟

复旦 “ 首发 ” 国产版 ChatGPT!名为 MOSS 惹群嘲,回应称:还非常不成熟

公众号新闻

CSDN(ID:CSDNnews)

身处科技圈的各位,最近应该都被 ChatGPT “刷屏”了吧。

不仅国外微软、谷歌、Meta 等科技巨头争相布局,国内百度、科大讯飞、华为、阿里巴巴、360、京东等大厂也集体“上车”:百度官宣最快 3 月份发布国产版 ChatGPT“文心一言”,科大讯飞称有信心百天内实现应用落地……

结果万万没想到,国内各大厂准备地如火如荼,但谁也没抢到这个“首发”:2 月 20 日晚,复旦大学自然语言处理实验室发布了国内首个类 ChatGPT 模型 MOSS,并邀请公众参与内测(https://moss.fastnlp.top/#/)


与 ChatGPT “类似”,但“落后”于 ChatGPT


从 MOSS 的项目主页来看,其定位是“一个类似 ChatGPT 的对话式语言模型”,能按照用户指示执行各种自然语言任务,包括回答问题、生成文本、总结文本和生成代码等等。

与 ChatGPT 一样,MOSS 的开发过程也包含了自然语言模型的基座训练和理解人类意图的对话能力训练两个阶段,但不同之处在于:

  • 基座预训练阶段,MOSS 的参数量要比 ChatGPT 少得多。据 MOSS 开发作者之一的复旦大学教授邱锡鹏透露,具体要“小一个数量级”,因此 MOSS 在任务完成度和知识储备量上,还有“很大提升空间”。
  • 对话训练阶段,OpenAI 使用 RLHF(Reinforcement learning with human feedback,即基于人类反馈的强化学习) 来培训 ChatGPT,而 MOSS 则是通过与人类和其他 AI 模型进行交互,学习效率和研发效率都得到了显著提升。
目前,MOSS 已拥有了一些 ChatGPT 的基本功能,复旦开发团队为此展示了几个与 MOSS 对话的示例:
  • 回答问题
  • 生成代码
  • 甚至,还能拒绝不合适的请求。
不过,虽然 MOSS 的基本功能与 ChatGPT 类似,但复旦开发团队坦言它仍有许多不足:
  • 由于训练数据中的多语言语料库有限,MOSS 在理解和生成英语以外的语言文本方面表现不佳。
  • 由于模型容量相对较小,MOSS 并不包含足够的世界知识,因此它生成的一些回答可能包含误导性或错误信息。
  • 有时 ,MOSS 会以迂回的方式执行,甚至无法遵循指令。在这种情况下,用户可能需要重新生成几次或修改提示以获得满意的回答。
  • 有时,MOSS 还会生成不道德或有害的回答。
在这些限制当中,其团队指出,作为国产版 ChatGPT,MOSS 的最大短板是中文水平不够高:“MOSS 的英文回答水平比中文高,因为它的模型基座学习了 3000 多亿个英文单词,中文词语只学了约 300 亿个。”据了解,造成这个缺陷的主要原因是,互联网上中文网页上如广告等干扰信息很多,因此清洗难度很大。
“尽管 MOSS 已经获得了 ChatGPT 的一些能力,但我们知道还有许多限制。由于缺乏高质量的数据、计算资源和模型能力,MOSS 仍远远落后于 ChatGPT。”基于这些原因,开发团队呼吁公众积极参与 MOSS 的内测并提供反馈,以便他们进一步优化与改进。

团队回应:MOSS 非常不成熟,距离 ChatGPT 还有很长的路要走

“ChatGPT 火了两个月,可算有国产版能让我们尝尝鲜了!”作为国内首个类 ChatGPT 模型,MOSS 一经发布就引来不少网友关注,尤其是它又与最近热映的《流浪地球》系列电影中人工智能 550W 量子计算机的“MOSS”重名。
一时之间,不论是关注 ChatGPT 的技术人,还是《流浪地球》的粉丝,都对这个 MOSS 一拥而上——结果,由于瞬时访问压力过大,MOSS 服务器当晚就被挤崩了。
与此同时,网上不断出现对 MOSS 的负面评论,认为复旦大学自然语言处理实验室的这个行为,不仅蹭了 ChatGPT 的热度,还蹭了《流浪地球》的热度:“一定要叫这个名字吗?”,“名字倒是很会取,反正先占个坑,炒个热度”,“还没学会走路,就要‘抢跑’了。”
对于服务器的意外崩溃以及陆续增多的质疑,今日复旦 MOSS 开发团队在其官网发布了一则公告作为回应:
  • “MOSS 还是一个非常不成熟的模型,距离 ChatGPT 还有很长的路需要走。”
  • “最初的想法只是想将 MOSS 进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注,我们的计算资源不足以支持如此大的访问量。”
  • “我们在训练完成第一代模型的时候,正值《流浪地球2》热映,片中 MOSS 给团队每个人都留下了深刻的印象,因此便使用了这样一个名称来指代我们的模型,以表示我们对最前沿 AI 模型的不懈追求。”
此外,复旦 MOSS 团队还表示,等到 MOSS 完成初步验证后,他们将开源 MOSS 的经验、代码和模型参数以供参考:“中国版 ChatGPT 的诞生还需要中国全体 AI 从业者的努力,也更需要不断和人交互以提高能力。”
不过,由 MOSS 暴露的这些短板以及引发的一系列争议,也令许多人再次意识到,国内想要研发出类 ChatGPT 的产品并不简单,而大公司更具优势:
  • “不仅需要一个团队能撬动各个方面的资源,还要有过硬的技术做支撑。目前来看,还真的只有大公司才有能力做得出来。”
  • “一个大学研究团队的人力、财力、算力,都不足以支撑一个可以供大众使用的 ChatGPT 这个级别的产品。这类产品还是要大公司来做。”
那么,你是否看好 MOSS,又对它有何评价呢?

参考链接:

  • https://txsun1997.github.io/blogs/moss.html

  • https://moss.fastnlp.top/#/

END

官方站点:www.linuxprobe.com

Linux命令大全:www.linuxcool.com

刘遄老师QQ:5604241

Linux技术交流群:3762708

(新群,火热加群中……)

想要学习Linux系统的读者可以点击"阅读原文"按钮来了解书籍《Linux就该这么学》,同时也非常适合专业的运维人员阅读,成为辅助您工作的高价值工具书!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
复旦抢发第一个中国版 ChatGPT !内测服务器被挤崩,团队致歉:还不成熟北京娘们,真牛!集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布GPT-4 重磅发布,吊打 ChatGPT!太太太强了!复旦团队发布类ChatGPT模型MOSS,服务崩掉后并给出回复ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!美丽的地方:“青蛙居住之地”用ChatGPT做PPT,太爽了!(附赠3个网站,1分钟做出绝美PPT!)突然出手!意大利封杀ChatGPT!马斯克也下场呼吁限制ChatGPT!AI发展可能超越人类思维?PK chatgpt 的诗评复旦开源首个「中国版ChatGPT」MOSS!全新插件系统,能上网,会鸡兔同笼复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!邀公众参与内测chatgpt 说顾城剽窃中医药就是吃饭喝水,夜宿早起8点1氪:复旦MOSS团队回应内测国内首个类ChatGPT模型;全球第5例艾滋病治愈者出现;10省份放宽公务员年龄限制至40周岁厉害了我的 ChatGPT, 弱复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!复旦推出类ChatGPT模型MOSS;京东百亿补贴降至;国人买苹果手机占12%年薪中国版ChatGPT「MOSS」服务器被挤爆,复旦团队致歉:还不成熟能做鱼汤、奶昔的多功能破壁机,用起来还非常安静!丨种草机复旦发布中国版ChatGPT:MOSS开启测试冲上热搜,服务器挤爆百度出手,国产版 ChatGPT 要来了GPT-4重磅发布,吊打ChatGPT!性能炸天:10秒做出一个网站,在考试中击败90% 人类匹兹堡记事 - 2022.12.26 伊利湖边的海鸥概念股暴涨!ChatGPT国产版要来?这一赛道风口来临chatGPT. 一本正经胡说八道0门槛克隆ChatGPT!30分钟训完,60亿参数性能堪比GPT-3.5复旦邱锡鹏团队发布类 ChatGPT 模型 MOSS,现已暂停内测国产版GPT接踵而来,算力平台谁来支撑?腾讯年终奖正常、退租朗科大厦3万平办公室,回应称:集中办公突发利空,中移动减持!复旦放大招:中国版ChatGPT来了,名字叫"MOSS"!大利好,私募基金可投住宅!河南人口负增长下雨了我就在家里练练手!复旦抢发类ChatGPT模型MOSS!被骂惨了,内测服务器挤崩Chatgpt 4 要release 了复旦放大招,国内首个类ChatGPT大模型开放测试!《流浪地球》MOSS照进现实ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!几行代码,GPT-3变ChatGPT!吴恩达高徒、华人CEO震撼发布Lamini引擎你看好哪家国产版类ChatGPT?爱奇艺被曝限制HDMI连线播放功能,回应称:应版权方要求
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。