Redian新闻
>
清华系ChatGPT发布!唐杰团队打造,专对中文优化,还能把握最新新闻动态

清华系ChatGPT发布!唐杰团队打造,专对中文优化,还能把握最新新闻动态

公众号新闻
丰色 发自 凹非寺
量子位 | 公众号 QbitAI

终于,清华大学唐杰团队也出手了。

就在GPT4发布的同一天,唐教授在微博宣布:

基于千亿参数大模型的对话机器人ChatGLM,现在开启邀请制内测。

据介绍,ChatGLM专门针对中文进行了优化,可以说是国人友好~

看起来,写博客提纲、创作剧本、解数学题、写代码,甚至是扮演高冷御姐,它都拿捏的死死的:

写介绍ChatGLM的博客提纲


Cosplay聊天扮演高冷御姐

量子位有幸拿到了内测名额,将在后文进行一波实测。

与此同时,还有另一个消息宣布:

唐杰团队为了与社区一起更好地推动大模型技术的发展,同时开源了包含62亿参数的双语ChatGLM-6B模型。

它最大的特点是在普通电脑上就能进行部署,有一块2080Ti就行。

一起来看看。

能写文言文致辞,知道何恺明最新动态,但……

先看ChatGLM,它是唐杰团队大模型家族时隔半年诞生的一位新成员。

alpha内测版名称叫QAGLM(全称qa-glm-v0.7)

浅试一下效果。

首先,我们让它说了一下它和ChatGPT的区别。

它点出了自己的研发机构,和擅长中文的特点。

那么,就让它用文言文写个致谢词叭。

咋说,虽然多了一个“余”、出现了一个莫名其妙的繁体字,但读着还可以,用的排比句增强了气势。

接着,我们把前几日硅谷暴雷的文章开头丢给它,让它起个标题。

感觉还不错,起码抓住了几个关键信息。

不幸的是,论文挑战没有通过,我们把GLM-130B的链接扔给它,让它简要概括一下主题时,它说的根本不是这篇。

跟ChatGPT胡邹参考文献的操作简直有得一拼(手动狗头)

接下来,考考它的数学能力吧。

这道小学应用题没问题:

不过鸡兔同笼,就难倒它了,最后居然还算出了负数==

编程方面,也可以解决简单的算法题。

归纳信息能力呢?我们给了一段英文需求,不难:

结果正确:

需要注意的是,目前ChatGLM每轮对话最多只可以进行5个来回,每次最多输入1000字。

它对新信息的掌握度不错,知道推特现在的CEO是马斯克,也知道何恺明3月10日回归学界的事情,但还没发现GPT-4已经发布了

以及,目前响应速度还是非常快的,无论什么问题,回答得对不对,基本几秒内就能给出答案。

最后,量子位也让它来了个cosplay,看看哄女朋友的本事如何:

emmm,虽然有点板正,但听完这段话“我”的气确实消了。

那么,以上就是我们的测试结果,各位觉得如何?

基于1300亿参数的基座模型打造

据官方介绍,ChatGLM参考了ChatGPT的设计思路,在千亿基座模型GLM-130B中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐(就是让机器的回答符合人类价值观、人类期望)

这个GLM-130B的来头值得说道一番。

它是由清华大学知识工程实验室(KEG)与智谱AI共同研发的一个大规模中英文预训练语言模型,参数1300亿,去年8月正式对外发布。

不同于BERT、GPT-3以及T5的架构,GLM-130B是一个包含多目标函数的自回归预训练模型。

它的优势包括:

在Stanford报告的30个世界主流大模型评测中,GLM-130B也成为了亚洲唯一入选的模型。

且获得了不错的成绩:

比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(作为公平对比,只对比无指令提示微调模型)中也可圈可点。

而就在CCF最近的一场会议上,有现场观众提问:ChatGPT为什么没有诞生在中国?是我们没有关注这件事吗?

嘉宾就把GLM-130B搬了出来(它也入选了ICLR’23)

现在,GLM-130B也终于被派上了“大用场”。

关于内测,唐杰团队表示,后续会逐步扩大范围,有兴趣的朋友可以再等一等。

60亿参数的缩小版同时开源

除了这个聊天机器人ChatGLM,唐杰团队这次也把GLM-130B的“缩小版”ChatGLM-6B开源了出来。

 GitHub已经揽获近2k标星

ChatGLM-6B使用与ChatGLM相同的技术,初具中文问答和对话功能。

特点如下:

当然,缺点就是容量只有60亿,其模型记忆和语言能力较弱,不擅长逻辑类问题(如数学、编程),以及多轮对话可能会出现上下文丢失和理解错误的情况。

但它主打的就是一个低门槛,在单张2080Ti上就能进行推理使用,硬件需求不高。

因此,只要有兴趣都可以下载下来试试,进行研究和(非商用的)应用开发都可以。

传送门:
https://chatglm.cn/
https://github.com/THUDM/ChatGLM-6B

参考链接:
[1]
https://weibo.com/2126427211/MxlsQ6w4A#repost
[2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d

3月29日「中国AIGC产业峰会」

抢票开启

「中国AIGC产业峰会」定档3月29日,线下会场抢票开启!

百度袁佛玉、智源林咏华、澜舟科技周明、小冰徐元春、科大讯飞高建清、启元世界袁泉、云舶科技梅嵩、特赞王喆、微软关玮雅、源码资本黄云刚、元语智能朱雷、无界Ai马千里、Tiamat青柑、峰瑞资本陈石等来自产学研界大咖嘉宾,还有重磅嘉宾陆续确认中。

扫描下方二维码,报名峰会线下会场啦~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
突发!王卫军,被查!A股疯狂星期四:光伏跌到“以为太阳没了”!中国版ChatGPT发布,巨头股价大跌!微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT和谷歌搜索不必二选一!爆火开源插件神器,中国团队打造谷歌急投20亿押注ChatGPT「最强竞品」,GPT-3核心成员出走打造,多方出击抗衡微软轻量版ChatGPT训练方法开源!仅用3天围绕LLaMA打造,号称训练速度比OpenAI快15倍GPT-3核心成员出走打造ChatGPT最强竞品!12项任务8项更强,最新估值50亿美元老海归的收入、纳税、理财揉碎南方,捏成自己 | 新新新青年玩法全开箱用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患秋色下的国王湖国家公园ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星ChatGPT发布最新美国大学排名:Top 10大洗牌、哥大反超斯坦福!留学圈吵翻天了「ChatGPT之母」最新采访:GPT-4离超级智能还很远,半年内不会训练GPT-5微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!重访西班牙(3)-穆斯林的嘉年华国殇2022,文学城网友的集体哀悼清华系千亿基座对话模型ChatGLM启动内测,开源单卡版模型(10个邀请码)还能这么玩?清华给 ChatGPT 做逆向,发现了 ChatGPT 的进化轨迹!ChatGPT引领AIGC!Lehigh最新《AI生成内容》全面综述,44页详述GAN到ChatGPT发展历程音视频业务挑战与优化实践,MXPlayer在线播放优化,数据分析与播放器优化GPT-4偷袭发布!ChatGPT能识图和逻辑推理,靠自己考上斯坦福【附发布会中英文字幕版】曹禺:再也写不出伟大的作品在暗房里做播客 | 新新新青年聚会视觉版ChatGPT来了!吸收AI画画全技能,MSRA全华人团队打造,微软16年老将领衔ChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!ChatGPT发布最新美国大学排名:Top 10大洗牌,哥大反超斯坦福!留学圈吵翻天了ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇2023年2月葡萄牙黄金签证获批人数激增!把握最后末班车30页论文!俞士纶团队新作:AIGC全面调查,从GAN到ChatGPT发展史重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患ChatGPT中文版来了!只需简单注册ChatGPT.bj,即刻使用【最先进】的AI工具~百度版ChatGPT发布会憋了这么久,就这?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。