为何又是清华系？

2023-10-22 09:10

今天是Olina陪你的第3118天

第1948章

Olina

持续日更

努力的创业者

陪你一起在路上

北京智谱华章科技有限公司（以下简称“智谱AI”）宣布今年已累计获得超25亿人民币融资，参与方主要包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投，华兴担任独家财务顾问。上述融资将用于基座大模型的进一步研发，更好地支撑行业生态，与合作伙伴一同高速发展。

一直以来，智谱AI专注于做大模型的自研创新。2020年，智谱AI开始了GLM预训练架构的研发，并训练了百亿参数模型GLM-10B。2021年，公司利用MoE架构成功训练出万亿稀疏模型，于次年合作研发了双语千亿级超大规模预训练模型GLM-130B，并基于此千亿基座模型开始打造大模型平台及产品矩阵。2023年，智谱AI推出了千亿基座的对话模型ChatGLM，并开源单卡版模型ChatGLM-6B，使得研究者和个人开发者进行微调和部署成为可能。当前，智谱AI的开源模型在全球下载量已超过1000万次。在细分领域方面，公司也打造了AIGC模型及产品矩阵，包括生成式AI提效助手智谱清言、高效率代码模型CodeGeeX等。

对于本次融资，顺为资本合伙人程天先生表示：“持续对新兴科技的探索是我们始终坚守的理念。随着数字化和智能化时代的到来，生成式AI通用模型逐渐成为新一轮科技创新的焦点。模型之于现代科技产品，犹如核心技术的‘心脏’，承载着信息处理和智能决策的重要功能。现阶段，智谱AI已成为国内大模型行业的佼佼者之一。它所提供的开源双语预训练语言模型「GLM-130B」和开源双语对话模型「ChatGLM-6B」都在行业内获得了广泛的认可。公司在模型技术研发上的能力和在市场落地策略上的前瞻性，都表明了其在国内市场取得阶段性领先地位。我们相信，在CEO张鹏的带领下，智谱将持续引领国内AI技术的前沿发展，为我国的数字化转型和AI技术发展做出更大的贡献。”

君联资本总裁李家庆表示：“人工智能产业处于快速发展阶段，商业化场景正从实验室走向产业化生产，人工智能技术将实现从感知智能到认知智能的新突破，在科技情报、虚拟数字人等领域，基于认知智能搭建的行业通用平台市场空间巨大。“大模型+大算力”是迈向通用人工智能的可行路径，未来基于大模型形成的变革性AI产业基础设施将改变当前单一模型对应单一任务的人工智能研发范式，多模态大模型将成为不同领域的共性平台技术。目前，智谱AI已取得多项国际领先的AI技术突破，在超大规模智能模型训练技术体系中占据领先地位，已具备构建我国人工智能应用通用基础设施的实力，未来有望通过推动人工智能技术的变革，为大量行业的开发者赋能，形成智能应用生态，成长为全球认知智能平台领军者。”

未来，智谱AI将基于完整的模型生态和全流程技术支持，继续为千行百业带来持续创新与变革，加速迈向通用人工智能的时代。

清华大牛联手，宣布融资超25亿

智谱AI的故事，始于2006年的清华实验室。

这一年，清华知识工程实验室里的一支团队发布了名为AMiner的产品，用来做科研情报的挖掘。这项技术在发布之初就积累了一批客户，而技术背后的带队人员则是清华计算机系的知名教授唐杰。

2019年，CEO张鹏等一行人带着这支团队走出清华实验室，智谱AI正式成立。

智谱AI CEO 张鹏

成立伊始，智谱AI就吸引到了中科创星、清华控股和华控汇金等一众投资机构。团队技术功底深厚，张鹏此前曾表示，公司是带着技术、带着团队、带着客户和市场直接启动的，“我们一边做核心的技术，一边拓展市场。从第一天开始，我们就有收入。”

2020年，大洋彼岸的GPT-3正式发布，OpenAI开始搅动人工智能行业。GPT的出现让唐杰和张鹏越来越确定，大模型将是未来发展的方向，于是，在智谱AI成立一周年之际，团队决定全力进行大模型的开发。2022年8月，GLM-130B正式诞生。

很快，智谱AI身后聚集了一批知名VC。就在GLM-130B发布的第二个月，智谱AI拿到了由君联资本和启明创投联合领投的1亿元B轮融资。此前，公司完成由达晨财智、华控基金、将门创投、南京图灵、北京达凡等参与的过亿元融资。

直至ChatGPT的爆火，大模型开始进入大众视野。今年7月，美团战投领投了智谱AI上亿美金的B-2轮融资，投后估值为5亿美金（约合36亿元人民币），开启了智谱AI今年浩浩荡荡的融资序幕。接下来的几个月，智谱AI陆续拿到数亿乃至数十亿元的多轮融资。

最终，智谱AI今年已累计获得超25亿人民币融资，参与方主要包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。

尽管是一家初创公司，智谱AI也频频出手投资。在大模型领域，智谱AI已经参与过聆心智能的天使轮和Pre-A轮融资；此外还曾投资过另一家清华系的大模型公司面壁智能，而面壁智能的联合创始人正是清华基础模型研究中心的副主任刘知远。

回望过去短短4年，大模型发生了翻天覆地的变化。成立之初，智谱AI团队曾写下了一个愿景——“让机器像人一样思考”。如今，这一愿景正在走进现实。

从阵痛到飞跃

回忆起多年来创业的历程，张鹏对阵痛和挫折记忆犹新。“尽管回头去看，这件事情还蛮简单的，但是这个探索的过程是非常艰苦的。”

“大模型”面向认知域，应用场景十分广泛。然而，“大模型”技术门槛高，其训练需要专业团队提供大量的算力支持，成本也很高，个人和团体通常难以负担。因此，将训练好的“大模型”作为服务推出，可以降低其使用成本，让科研成果惠及更多的企业和团队。

起初，“大模型”的研发者普遍追求数量，参数由千亿甚至到万亿，然而智谱AI则将目光放在算法的优化上，通过训练让它的性能更高效，同参数规模达成一定的平衡。限制规模的好处在于模型投入使用的时候对算力的消耗更小，即使是算力有限的场景，仍然可以成功使用大模型，这样就做到了让“大模型”更具普适性。

2022年，智谱AI联合清华大学打造了高精度双语千亿模型GLM-130B，构建了高精度通用知识图谱，形成数据与知识双轮驱动的认知引擎。在训练GLM-130B时，智谱的理想是世界上任何一个人都可以免费下载千亿模型，并在一台低配的GPU 服务器上就可以使用它。

在这期间，团队面临两个核心问题：一是缺乏高质量的预训练算法，针对双语的高质量预训练算法还有待验证和提升。二是缺乏快速推理方法，快速推理方法是保证模型能在低配GPU服务器上运行起来的基础，也是让每个人都能用得上千亿大模型的关键。

对于预训练模型架构算法，团队联合清华大学于2021 年提出了 GLM（General Language Model）算法框架，其在多个任务上表现出了不俗的性能。若GPT的原理可以被⽐作“根据上文做续写”，那么GLM的依据则从上⽂扩充到上下⽂，并可以同时完成续写和填空。理论上，GLM的训练效率会比GPT更高，也能理解更复杂的场景。经过几轮激烈的争论，团队最终决定训练一个 1300 亿参数的 GLM 模型。一来千亿稠密模型能保证高精度，另一方面这个规模还可以在一台 A100 服务器上就进行单机推理。整个训练过程横跨两个月，在此期间，团队开始考虑训练完成后的推理解决方案，并在一台 V100（32G * 8）服务器上实现了合理速度的 130B 模型推理。

在训练过程中，团队遇到了很多挑战，预训练一个高精度的千亿模型与训练百亿模型完全不同——频繁的随机硬件故障、模型梯度爆炸、算法中意外的过多内存使用、新的 Megatron 和 DeepSpeed 框架中 3D 流水线的调试、无法从优化器状态中恢复、机器间 TCP 拥塞，以及许多许多意外的 “bug”，最终这些问题被一一攻克。

随后，智谱AI将GLM-130B模型开源，放到了GitHub上，让模型更快服务于产业发展，并在公共平台上通过API的方式让所有人方便地使用大模型；同时，还为客户提供了很多具体的服务，比如提供大模型的授权产品并将其部署至客户内网，以及为客户设计大模型培训课程，实现“授人予渔”。

除此之外，智谱AI在算法上做了新的开发，使智谱大模型系列能够支持更多国产化的算力平台，并积极探索大模型的商业化应用路径，打造更具商业应用前景、更具易用性的开放性生态平台。

从冲击中突破

2020年5月，OpenAI发布了GPT-3，将预训练模型的参数规模推到了1000亿以上。模型表现出了超乎想象的智能水准，也激发了智谱AI对参数量的重视，坚定了他们投入更多资源和精力去做模型的决心。他们预感到，基于GPT-3这样一个优秀千亿基座的智能应用会迎来爆发。 2022年末，ChatGPT的发布传达给智谱AI一个明显的信号：预训练模型已经到了完全可使⽤且好⽤的阶段，是产品化很好的范例。

同行的启发、市场的期待、多年的积淀……智谱AI很快顺势推出了千亿基座的对话模型ChatGLM，并开源单卡版模型ChatGLM-6B，使得研究者和个人开发者进行微调和部署成为可能。在细分领域方面，团队打造了AIGC模型及产品矩阵，包括生成式AI 提效助手“智谱清言”、高效率代码模型CodeGeeX等。

今年6月，智谱AI将千亿模型ChatGLM升级到二代，效果大幅提升，模型支持的上下文长度扩展到32K，并大幅提高推理速度。基于基座模型能力的增强，AI提效助手“智谱清言”已具备更强大的性能，在多轮对话当中，作为一个“有知识、有记忆”的AI助手，其对上下文理解长度已从2K拓展至32K，储备了包括科学、技术、历史、文化、艺术、商业和其他垂直领域的丰富知识，以此保障用户人机对话体验，持续畅聊无压力。目前产品已具备通用问答、多轮对话、创意写作、代码生成以及虚拟对话、多模态生成等丰富能力。

“中国没有⾃⼰的预训练模型框架。⽆论是GPT、BERT，还是T5，都是西⽅的科学家提出的底层技术，路径是被西⽅垄断的状态。”智谱AI希望在完整的模型生态和全流程技术支持下，打破垄断局面，走出有中国特色的人工智能之路，通过认知大模型链接物理世界的亿级用户，为千行百业带来持续创新与变革，加速迈向通用人工智能的时代。

为何又是清华系？

阿里腾讯小米罕见联手的一幕，本周已是第二次上演。

10月17日，百川智能宣布已完成3亿美元的A1轮战略融资，阿里、腾讯、小米等科技巨头参投了本轮融资，公司正式跻身科技独角兽行列，创下国内大模型初创企业最快晋升独角兽的记录。此外，深创投、基石资本、红点中国、卓源资本、顺为资本等机构也纷纷参与。

百川智能的创始人，创投圈并不陌生——王小川。1996年，王小川被点招入清华大学计算机系，研究生毕业后便加入搜狐。从搜狐到搜狗，王小川在互联网时代留下了不少记忆。直到今年4月，他官宣自己的大模型创业之旅，旨在打造中国版OpenAI。

在王小川之前，同为清华校友的王慧文率先打破了大模型江湖的平静。今年年初，王慧文宣布进军人工智能领域，为自己参与创立的AI公司光年之外招揽人才，本人率先出资5000万美元。作为清华老同学，王兴鼎力支持，参与了光年之外的A轮投资，并出任董事。

期间，光年之外还与一流科技达成并购，后者成立于2017年，创始人兼CEO袁进辉同样为清华校友，是该校计算机系工学博士，曾任微软亚洲研究院主管研究员。但可惜的是，王慧文在6月底被曝出因病离岗，光年之外随后也被美团全资收购。

同样备受关注的还有大模型创业公司月之暗面——由清华大学交叉信息学院、智源青年科学家杨植麟教授领衔，两位联合创始人周昕宇和吴育昕也均出身清华。投资界获悉，公司已获得红杉、今日资本、砺思资本、真格基金等知名机构近20亿元投资。

为何清华系创业者会在AI赛道一骑绝尘？

这还要从45年前说起。早在1978年，清华大学就在计算机系内部成立了“人工智能与智能控制”教研组，在“计算机应用技木”学科下，开展人工智能方向的本科教学。随后在1979年，清华大学开始为本科生开设《人工智能导论》的选修课；1983年清华计算机系又修订了其本科教育的培养计划，将《人工智能》列为本科必修课程。

从1978年开始，清华开始招收人工智能硕士研究生，首届6名硕士生，分别为张国煊、张轴材、王家钦、郑学忠、唐建邦、严隽薇，这六人也先后成为各领域的关键人物。而在1986年，清华也开始招收人工智能方向的博士生，截止到2020年，已经培养了250名左右的博士生。

清华还曾举办三期讲席教授组织，邀请世界著名的教授来参与清华的培养工作。主要内容是讲课和联合培养博士生，并且要求教授组每年累计保证9个月在清华大学工作。其中第一期是2003年到2006年，参与人主要是计算机科学理论的教授，其中包括了图灵奖获得者姚期智。后来，姚期智也因这次受聘，直接回到清华大学担任长聘教授，并在2005年创建了姚班，被称之为国内人工智能产业的殿堂。

在同样是清华校友的源码资本合伙人王星石看来，清华系AI创业者拥有强烈的科技创新愿景，善于深度探究事物的本质和规律，践行上坚守务实态度。

这离不开清华的底层文化。王星石说，清华一直推崇务实与创新，秉持为国家持续输出优秀高科技人才的理念，鼓励创业创新。因此在整体文化和氛围的烘托下，更容易催生和激发创业意识。“当一些行业如AI有创业创新机会时，这些专业知识过硬，又有创新思维和创业精神的同学，就会抓住机会，从而冲出不少顶尖创业者。”

中国AI江湖三大门派

正所谓“北清华，南交大”，上海交大系也是AI江湖中响当当的一支力量。

最新一幕是9月28日，第四范式正式登陆港交所，市值超260亿港元。第四范式的创始人是一位年轻的上海交大学霸——戴文渊。自小酷爱计算机的他，凭借着竞赛拿到保送上海交大的名额，就读于赫赫有名的ACM班。大学期间，他一举夺得ACM世界冠军和三个亚洲冠军。毕业后，戴文渊成为百度当时最年轻的科学家，又在2014年9月创立了第四范式。

鲜为人知的是，第四范式执行董事兼首席研究科学家陈雨强、首席架构师胡时伟、副总裁郑曌也是上海交大校友。

还有商汤联合创始人、现任CEO徐立。他2000年被保送至上海交大计算机系，四年后更是又直接被保送研究生。随后，他在香港中文大学计算机科学与工程系取得博士学位。在港中大，徐立结识了汤晓鸥教授，在实验室中一手创立了商汤科技。

回顾历史，上海交大是国内最早涉足AI领域的高校之一。早在1973年，上海交大就成立了我国高校建立最早、规模最大的计算中心之一——上海交大网络信息中心，并逐步搭建起国内顶尖的AI计算平台。

上海交大最为赫赫有名的便是ACM班，该班级由俞勇教授创立于2002年。在字节跳动成立8周年时，张一鸣在内部信中曾提到ACM班：有一段时间，我发现公司好多优秀的算法人才都来自上海交大ACM班，我特地去上海拜访了俞勇老师。

这里走出了一批计算机界的传奇人物。据不完全统计，ACM班走出来的学生遍布在众多人工智能方向，包括依图科技联合创始人林晨曦、壁仞科技联合创始人徐凌杰、禾赛科技董事长、首席科学家孙恺等等。毫无疑问，人工智能已经成为上海交大的王牌专业。

在AI江湖中还有一座高校星光熠熠——坐落于合肥的中国科学技术大学。

最具代表性的案例当属寒武纪科技。公司创始人陈云霁、陈天石兄弟，都曾就读于中国科大少年班，是国内外学术界享有盛誉的杰出青年科学家。2016年，兄弟二人联合创办寒武纪科技，成为AI芯片第一家独角兽企业，并在2020年成功登陆科创板。

“AI四小龙”之一的云从科技也是中国科大校友企业。1981年，周曦出生于四川内江市，先后考入中国科学技术大学、美国伊利诺伊大学香槟分校，取得了计算机博士学位。2011年，周曦放弃留美，选择回到重庆研究AI，云从科技也在4年后诞生。去年5月，云从科技正式挂牌科创板。

活跃在AI领域的中国科大校友不胜枚举：中国工程院院士张亚勤、商汤创始人汤晓鸥、科大讯飞创始人刘庆峰、原阿里云首席科学家闵万里、云知声创始人梁家恩……队伍壮观。

路漫漫其修远兮，吾将上下而求索。毋庸置疑，中国需要诞生自己的OpenAI，也终将诞生属于自己的OpenAI。而在这条求知路上，出身于各大高校的中国AI军团，正在浩浩荡荡集结，共同奔赴远方。

今年，无论是技术热度还是资本热度，大模型都一骑绝尘。

而国内大模型，常被调侃的一句话就是“被清华系创业公司占去半壁江山”。

此话倒是不假。

目前赛道上的明星，无论是今日曝光25亿融资数目的智谱，前几日曝光累计融资3.5亿的百川，还是深言科技、月之暗面、面壁智能、生数科技等，都出自清华一脉。

同侪甚至是同门竞争，让本来就激烈的赛道看点更足。

不过如月之暗面创始人、清华叉院助理教授杨植麟在媒体沟通会上所说，“（大模型）里面空间非常大，大家侧重点不同，技术路线也不一样”。

确实，很难有一家公司可以把通往AGI之路上的所有事情都做了。

So，无论是智谱、其余清华系大模型公司，还是其他创业大模型的团队，干就完事儿了～

说点击下方 “在看”

能让运气变得更好哦～

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章