Redian新闻
>
复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

复旦发布国内首个类ChatGPT模型!已开放内测申请,代码将于3月发布

公众号新闻
Pine 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

没想到,众人加班加点抢“中国版ChatGPT”热度时,首个国内类ChatGPT模型竟然已经发布了!

砸出这个重磅消息的,不是紧锣密鼓宣传的BAT大厂,也不是直接出手几亿的投资大V,而是这段时间来一直没吭气的复旦大学

事情一出,直接引爆了一众社交媒体,不仅在微博刷出数个热搜话题,知乎更是冲上热榜第一。

各路“ChatGPT爱好者”连夜赶来围观,甚至由于官网访问人数太多,服务器一度被挤爆,又上了一次热搜。

这是怎么回事?

原来,复旦NLP团队这个类ChatGPT模型,发布即面向公众进行内测,甚至连预告都没有:

紧接着,团队又投下另一颗重磅炸弹:模型3月份就会开源代码

最关键的是模型的名字。

复旦团队用了《流浪地球》里面拥有自我意识的AI——MOSS来命名这一模型,直接把消息热度推上顶峰。

有网友表示,MOSS率先开放至少有一大优势,那就是“获得更多数据”:

ChatGPT有一个巨大的先发优势,就是通过抢先开始公测收集大量用户数据,并且这部分数据现阶段只有人家有。

算法都是成熟且公开的算法,真正的核心其实是数据和硬件。

说回模型本身。据MOSS自己介绍,它同样具备ChatGPT能实现的这些功能:

问答、文本翻译、摘要总结、故事撰写、情绪分析、建议提供、代码和算法编写等。

但实际测试效果又是如何,具体训练方法和效果会不会有什么差异?

我们一步步来看。

MOSS与ChatGPT相比效果如何?

据团队介绍,MOSS与ChatGPT主要有三大差异

最主要的就是参数量的不同。MOSS模型的参数量比ChatGPT小了一个数量级。

然后是训练方式的不同。虽然MOSS也是自然语言模型基座训练+理解人类意图对话能力训练,但后者的训练方式与ChatGPT采用的RLHF不同。

复旦团队没有采取人工标注(指令微调)的方式来进行理解对话能力训练,而是基于与其他AI对话模型的交互来训练自己。

没错,相比人类调教,MOSS直接选择和其他AI模型进行对话……

最后是开放程度不同。ChatGPT背后模型目前还没有开源,但MOSS承诺会将代码开源。

说了这么多,MOSS的效果具体如何?

从官方给出示例来看,它问答和生成代码的能力似乎还不错。

在问答环节中,让MOSS列五部科幻片,分分钟就能给出(不过,《黑镜》好像是电视剧?)

做表格的速度也非常快:

在代码生成中,写个快速排序算法也没问题:

与ChatGPT相比,MOSS的实测效果究竟如何呢?

知乎已经有匿名用户称已经拿到了内测资格,并实时更新了一波测试结果,我们将MOSS的回答与ChatGPT简单对比一下。

第一轮,先来看看写文章的能力。

例如“帮忙写一下国家自然科学基金申请,杰青那种”,MOSS回答如下:

我们把问题拿给ChatGPT后,得到了这样的回答:

第二轮,来看看写代码的能力。

这是MOSS给出的代码实现:

完整代码:for(i=1:length(mat文件中的名字)){name = mat文件中的名字[i];data = {name};fprintf(‘%s,’,name);}end for

这是ChatGPT给出的代码与回答:

第三轮,测试一下算法题的效果。

MOSS给出了一个实现思路:

ChatGPT则包办了代码和具体算法实现的流程:

最后一轮,再来看看做数学题的能力。

不过从功能介绍来看,MOSS应该还不具备解数学题的能力,这个问题确实不一定能回答出来。

ChatGPT则列了个方程解决这个问题:

整体来看,MOSS虽然在算法题上表现出了一定的逻辑,但在包括写文章、做数学题等具体解决方案的提供上,还有待继续训练提升。

“只是想验证ChatGPT技术路线”

针对种种疑问,团队也在官网上做出了回应。

首先,是MOSS与ChatGPT的差距上。团队表示,目前它还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走:

我们一个实验室无法做出和ChatGPT能力相近的模型,只是想在百亿规模参数上探索和验证ChatGPT的技术路线。

接下来,是针对服务器被挤爆的回应:

我们没想到会引起这么大关注,计算资源不足以支持如此大访问量,向大家致以真诚的歉意。

最后还有关于命名MOSS的回应:

就像过去NLP领域的其他优秀模型一样,作者们都希望使用自己喜欢的影视角色名称命名自己的模型。

此外,研究团队还在介绍网站中详细列出了MOSS的限制因素:

  • 训练数据中的多语言语料库有限;

  • 模型容量相对较小,不包含足够的世界知识;

  • 执行方式比较迂回,甚至不按照指示执行;

  • 可能会生产不道德或有害的内容;
    ……

总结下来,就是MOSS的回答不及ChatGPT就是因为它缺乏高质量的数据、计算资源以及模型容量

不过,有意思的是,团队表示,在这些问题里面MOSS的最大短板是中文水平不够高

具体来说,相较于英文问答能力,MOSS的中文问答水平要低很多,这也与前面提到的预训练模型学习数据量有关:

它的模型基座学习了3000多亿个英文单词,而互联网上的中文网页干扰信息如广告很多,清洗难度很大,导致中文词语只学了约300亿个

目前,复旦大学NLP实验室正在加紧推进中文语料的清洗工作,清洗后的高质量中文语料也将用于下一阶段模型训练。

当然,和ChatGPT相比,MOSS也不是“一无是处”(手动狗头),起码它会在3月份开源代码

而这一把也将会直接有效降低预训练语言模型的研发和应用门槛,属实是利好中小企业了,邱锡鹏教授也表示:

MOSS的计算量相对不那么大,中小企业都能用起来。

此外,研究团队对MOSS的“野心”似乎还不止于对话问答、写代码等这些ChatGPT拥有的功能。

在这次面向公众内测的同时,团队还透露出了MOSS的下一步计划:

结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、谱曲和教学,并加强它辅助科学家进行高效科研的能力等。

研究团队

MOSS是复旦大学自然语言处理实验室的成果,并且该项目还得到了上海人工智能实验室的支持。

研究团队由邱锡鹏带队,其余几位均为复旦大学NLP实验室的成员。

复旦大学自然语言处理实验室,是由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。

目前实验室已经发表了大量高水平国际期刊和会议论文,其中包括中国计算机学会推荐的A/B类国际会议和期刊论文(ACL,SIGIR,IJCAI,AAAI,NIPS,ICML等)论文150余篇。

此外,复旦NLP实验室还发布了国内首家中文自然语言开源系统FudanNLP,被包括联合国教科文组织在内的国内外多家研发机构采用。

邱锡鹏,复旦大学计算机科学技术学院教授,博士生导师,研究方向为自然语言处理、深度学习,发表CCF-A/B类论文70余篇。

他还主持开发了开源自然语言处理工具:FudanNLP 、FastNLP,获得了学术界和产业界的广泛使用。

对于复旦MOSS模型的发布,你的看法是?

参考链接:
[1] https://txsun1997.github.io/blogs/moss.html

[2] https://www.shobserver.com/staticsg/res/html/web/newsDetail.html?id=584634
[3] https://www.zhihu.com/question/585248111/answer/2903204899
[4] https://xpqiu.github.io/index.html

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”?最有竞争力和潜力的AIGC力量位于何方?

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术能够被大众看到。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
8点1氪:复旦MOSS团队回应内测国内首个类ChatGPT模型;全球第5例艾滋病治愈者出现;10省份放宽公务员年龄限制至40周岁复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!水滴公司:已在内测类ChatGPT应用,主要用于保险营销和服务复旦放大招,国内首个类ChatGPT大模型开放测试!《流浪地球》MOSS照进现实2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载国内首个类ChatGPT模型发布/苹果阻止免费安装iOS 17开测版/小米汽车再曝光懒人花园:姹紫嫣红的岁月乌克兰来美国,俄罗斯去中国,巧合吗?百度将于3月推出类ChatGPT风格的机器人,嵌入到自家搜索服务中“WPS AI”发布 金山办公推出国内协同办公首个类ChatGPT应用复旦推出类ChatGPT模型MOSS;京东百亿补贴降至;国人买苹果手机占12%年薪复旦邱锡鹏团队发布类 ChatGPT 模型 MOSS,现已暂停内测ChatGPT预测申论考点被老师点赞/ LOFTER的AI绘画遭质疑/ Meta被曝本周再裁数千人...今日更多新鲜事在此复旦抢发类ChatGPT模型MOSS!被骂惨了,内测服务器挤崩复旦团队发布类ChatGPT模型MOSS,服务崩掉后并给出回复谷歌 Bard 演示失误,股价重挫7%;迪士尼宣布裁员 7000 人;阿里类ChatGPT产品已开始内测 | 极客早知道部署国产ChatGPT仅需6G显存!ChatYuan模型开放下载:业内首个功能型对话开源中文大模型国内首个类ChatGPT模型将开源/iPhone 15 Pro系列渲染图曝光/Meta加入硅谷AI竞赛OATLY天猫新店开业;百度版ChatGPT将于3 月开放;茑屋书店在北京开首店... | 刀法品牌热讯美团创始高管离职创业/ 国内首个类ChatGPT下月开源/ 推特员工睡公司仍被裁 ...今日更多新鲜事在此ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报成本不到100美元!UC伯克利再开源类ChatGPT模型「考拉」:数据量大没有用,高质量才是王道微软开源“傻瓜式”类ChatGPT模型训练工具,提速省钱15倍ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此复旦发布中国版ChatGPT:MOSS开启测试冲上热搜,服务器挤爆服务器一夜挤爆!复旦发布中国版ChatGPT出师不利被网友挤崩了!复旦发布中国版ChatGPT,中文竟不如英文好…时尚米兰,现代米兰北京沦陷后谈疫苗和体制优势复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!邀公众参与内测美国宾州葛底斯堡国家军事公园,秋色田园视觉ChatGPT来了,微软发布,代码已开源8点1氪:家乐福中国COO离职,多数门店经营异常;阿里类ChatGPT产品已进入内测阶段;苹果“先买后付”功能或将推出
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。