Redian新闻
>
ChatGPT造孽!中国高校因它算力荒

ChatGPT造孽!中国高校因它算力荒

科技
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

不做大模型,就没有算力用。

这是ChatGPT点燃AI风口后,国内某top3高校AI实验室的残酷现状。

同一个实验室里,非大模型团队6人用4块3090卡,比起同实验室的大模型团队10个人用10块A800卡,本就已经不算富裕。

现在,校企合作也更偏爱大模型。去年11月ChatGPT发布后,与非大模型团队合作的企业骤减,近期找上门的,也是张口就问:

“你们做大模型不?”

做,有高校和企业的通力支持;不做?那就只能眼睁睁看着算力花落别家。

哪怕某量化私募基金的有10000张A100卡,还对高校研究团队开放申请,也不见得能落一张到你头上。

“要是我们组能分到一些就好了。”看到这条微博,非大模型团队带队的数据科学方向博士小哥羡慕不已,因为缺算力,他都愁得仰天长啸了:我们也值得投资啊!!!

现在,大伙争先恐后扑向ChatGPT背后GPT-3.5般的各种大模型,算力流向亦然。

其他AI领域本就不足的算力更荒了,尤其是国内学界手里的算力分配下来,贫富差距肉眼可见。

一整个实验室就4块3090卡

巨大规模算力以月为单位的租用成本,对研究团队来说不是小数目。大模型正当其道,学界研究大模型的实验室或团队拥有算力资源的优先分配权

就拿小哥在学校的亲身体验来说,在他们研究室,大模型小组10个人有10块A800卡可用,而另一个研究传统机器学习方向的实验室,整个实验室只有4块3090卡

拥抱主流趋势是一重原因,另一重原因是实验室需要运转和维护的经费,获得拨款的一种形式是申请国家项目,但必要步骤是提供论文成果。

双重原因下,本就不多的算力资源,不得不优先分配给大模型这样热门且相对容易出成果的研究。哪怕对学界来说,训一个大模型其实练不太动——因为数据、算力和资金都有些捉襟见肘。

为了获得更多的资源,有的非大模型实验室甚至额外专门成立研究大模型的团队。

当然,想要获得资金和资源,校企合作也是不可或缺的一种方式。

这种推动产研融合的重要支撑形式持续已久,2020年,KDD中校企合作论文占比超过50%,这个比例在ICCV中达到45%。

举例来说,2021年,清华大学KEG、PACMAN(并行与分布式计算机系统)、NLP等实验室着手推进训练千亿参数的稠密模型,但团队用于训练模型的计算资源并不充足。最终,校外企业智谱AI租用了近百台A100的服务器,免费提供所需算力,这才有了双语预训练语言大模型GLM-130B的诞生。

GLM-130B的任务表现

但在众人争先恐后扑向GPT-3.5般大模型的当下,非大模型团队开始不太好谈这类合作了。

去年11月ChatGPT发布后,与小哥所在团队洽谈校企合作事宜的公司数量急剧减少。在其他高校,AI领域的非大模型团队也总是面临企业询问,“要不要/会不会做大模型”。

本就稀缺的算力,在学界有成为追逐热点的砝码的倾向,算力资源分配的马太效应由此逐渐扩大,带给学术研究很大困扰。

ChatGPT加剧算力分配贫富分化

算力是AI飞速发展必不可少的指标,2018年,OpenAI发布的报告中点出一个算力趋势

自2012年以来,AI训练任务所运用的算力每3.43个月就会翻倍。到2018年,AI算力需求增长了30万倍。

产学研对算力需求暴增,我们能提供的算力有多少?

据中国算力集团统计,截至2022年6月底,我国数据中心机架使用总规模超过590万标准机架,服务器规模约2000万台,算力总规模排名全球第2

这个排名还算不错,但摊开来看仍旧远远不够,毕竟放眼全球,没有哪个国家不是嗷嗷待哺,等着更多的算力资源“投喂”

再退一步讲,买得起显卡,拥有的算力上去了,电费也是天文数字。

况且我国还有特殊情况——

开放原子开源基金会业务发展部部长朱其罡在本月举办的CCF YOCSEF上发言阐述现状称,超算领域的核心技术,一个是IBM LSF超算系统,一个是开源系统。目前,国内多数超算中心都基于开源系统做封装,但这个版本调度资源的效率和能力都有很大的提升空间。

以及,因为众所周知的原因,A100、H100这俩目前性能最强的GPU,还没找到可规模替代的方案。

英伟达A100显卡

综上,算力不够已是积弊,但ChatGPT时代,算力需求剧烈扩张,除了大量训练算力,大量推理算力也需要支撑。

所以现在的情况是,因为ChatGPT显示出大模型的推理能力,训练和研究大模型的算力需求增加;同时因为大模型热度爆棚,蜂拥至大模型的算力资源也增加。

分配给大模型领域的算力资源丰富起来,其他AI领域缺衣少食的情况逐渐加剧,研发能力受到掣肘。

可以说,ChatGPT成为如今的AI届白月光后,加剧了算力分配的贫富分化

这般“富”甲一方的大模型,是不是AI研究路径上最好的?还没人能够回答。

但值得引起注意和重视的是,GPT系列为首的大模型不应该吸引全部目光,整个AI领域还有各种各样的研究方向,还有更加细分的垂直领域,以及带来更多生产力的模型和产品。

当ChatGPT的热度趋于平缓,学界的算力资源分配差距会缩小吗?

所有非大模型方向的实验室和团队,恐怕都在期待之中。

— 联系作者 —

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

被ChatGPT带飞的AIGC如何在中国落地?量子位邀你共同参与中国AIGC产业峰会


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT 或导致 20 种工作失业?恐怕远远不止,比尔盖茨 :ChatGPT 将改变世界孟晚舟将首次出任华为轮值董事长/ 百度All in类ChatGPT项目/ 知乎因ChatGPT大涨50%…今日更多新鲜事在此华尔街交易员为何不担心ChatGPT抢饭碗?ChatGPT:我预测不了市场金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题造孽!重庆一小区垃圾桶惊现大量未拆封布洛芬,发国难财的报应来了:当初有多气人,现在就有多活该百度版ChatGPT确定为“文心一言”/ 戴尔裁员5%/ 苹果要开会应对ChatGPT…今日更多新鲜事在此剽窃、作弊,ChatGPT竟偷偷生成了12篇署名论文!Marcus炮轰Ta变成CheatGPT微信回应头像褪色,部分C刊不准隐瞒ChatGPT使用,微软推进裁员,Opera新版集成ChatGPT,这就是今天的其它大新闻!反击!Google 版 ChatGPT 首次亮相,有一个功能「碾压」ChatGPTChatGPT 进军 B 端?消息称微软将允许企业创建定制版 ChatGPTChatGPT带火AI芯片,赚翻了的英伟达发布新核弹:ChatGPT专用GPU,让推理提速10倍!重磅!微软发布 ChatGPT 版搜索引擎,用上了比 ChatGPT 更强大的技术科早ChatGPT:如何应对ChatGPT?二级市场闭门研讨会精选 | S7E01 硅谷徐老师全球都为ChatGPT疯狂,它到底是风口还是虚火?深度解读风暴眼中的ChatGPT | 直播预约ChatGPT惹怒主流媒体!华尔街日报、CNN授权费都没付!马斯克:ChatGPT好得吓人;用户吐槽:它有时会一本正经的胡说八道日本啊,日本(二十二)中国寺庙,日本寺庙下载量暴增10倍!微软必应集成ChatGPT后需求大爆发;4省份上调最低工资标准;淘宝已屏蔽ChatGPT关键词丨邦早报重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患紧急提醒!ChatGPT成神器!但这些“ChatGPT”是假的,小心被骗!朋友圈全是ChatGPT! ChatGPT概念股大火ChatGPT能有意识吗:关于ChatGPT的误解与夸大毛泽东儿子接受贫下中农再教育警幻仙姑的人间真容哇!五年前我就这么牛了 ?集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报造孽!4月4乐山大佛惊现一女子爬上佛头算力芯片+服务器+数据中心,如何测算ChatGPT算力需求?跟ChatGPT,聊聊ChatGPTOpenAI领投,这家机器人公司要给ChatGPT造个身体?我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT通过谷歌程序员面试,薪资达18.3万美元!ChatGPT来了,美国高校如临大敌,教育界坐不住了?苏月的婚姻路(完)ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。