国际科技财经博客移民网络热点娱乐民生时事公众号

>

OpenAI把微软电网搞崩！GPT-6被曝25年发布，训练刷爆10万张H100

OpenAI把微软电网搞崩！GPT-6被曝25年发布，训练刷爆10万张H100

2024-03-27 05:03

新智元报道

编辑：编辑部

【新智元导读】GPT-5还未发布，GPT-6已经在路上了？微软工程师曝出，为GPT-6搭建10万个H100训练集群，整个电网却被搞崩。通往AGI大关，还需要破解电力难题。

GPT-6也被电力卡脖子了——部署十万个H100时，整个电网发生了崩溃！

就在刚刚，微软工程师爆料，10万个H100基建正在紧锣密鼓地建设中，目的就是训练GPT-6。

微软工程师吐槽说，团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。

Corbitt：为何不考虑直接将所有设备部署在同一个地区呢？

微软工程师：这确实是我们最初的方案。但问题是，一旦我们在同一个州部署超过100,000个H100 GPU，电网就会因无法负荷而崩溃。

这是创业者Kyle Corbitt在社交媒体上，分享自己与一位微软工程师关于GPT-6训练集群项目的对话

没想到，GPT-5还没发，微软就已悄悄为OpenAI开始训练GPT-6了。

同在今天，一张「OpenAI内部时间线」图片在网上疯转。

图中清晰标注出：OpenAI早在2022年8月-10月之间开始了GPT-5（代号Arrakis）的训练，2023年4月GPT-4.5（代号Gobi）在训练中。

并且图中显示，GPT-6的测试，预计早在去年9月就开始了！

同时，关于GPT-5（Arrakis）的一个爆料帖，也随之浮出水面。

太长不看版

贴中爆出许多内幕消息。

比如，GPT-4.5因为能力不够，干脆被跳过，所以今年OpenAI会直接发GPT-5。

另外还有若干未经证实的消息（从上图中也可以看出），关于OpenAI手中握着的一大把模型——

比如，Arrakis/GPT-5在GPT-4不久后训练了3个月，于22年10月结束；在GPT-5之后，GPT-4.5于23年4月完成训练。

最劲爆的消息当然就是，现在GPT-6或许已经在训练中了。

但是，GPT-5并不是AGI，因为无法解决「量子引力」问题。同理，GPT-6也不是AGI。

接下来，让我们一一盘点下，帖子中都有哪些信息点。

最接近AGI的模型，与人类专家不相上下

去年8月，FeltSteam最先曝出OpenAI内部正在进行一个Arrakis多模态模型的项目，远超GPT-4，非常接近AGI。

Arrakis项目被首次提及，是名叫FeltSteam的网友最先在Reddit一个评论区中爆料称，「Arrakis和Gobi都很酷」。

并且，他在r/singularity板块中另一个问题下，介绍了Arrakis的一些能力。

他提到，「这是一个无所不能的模型，可以输入文本、图像、音频和视频的任何组合」。

具体来说，Arrakis更多的细节包括：

- 多模态模型

- 性能远超GPT-4

- 接近AGI

- 幻觉发生率明显低于GPT-4

- Altman正试图将Arrakis作为一种工具来推销，尽管它是有感情的

- 推理成本略低于GPT-4

- 非常优秀的自主智能体

- 训练一般数据是合成的

与此同时，Jimmy Apples在社交媒体上曝出了OpenAI内部代号Gobi的项目——大规模多模态模型。

除了以上两个项目，一个代号名为「Sunshine」的项目逐渐浮出水面。

OpenAI这些秘密进行的项目，一时间引来许多网友的猜测和讨论。

随后，FeltSteam又爆出了更多的细节，Arrakis据称有125万亿参数，大约是GPT-4的100倍，并在2022年10月完成训练。

值得一提的是，Arrakis不是通过计算资源实现的，而是通过提高计算效率实现的。

目前，OpenAI内部也在使用Arrakis进行研究，不过整体员工水平肯定优于Arrakis。另外，与GPT-5相比，Gobi更接近GPT-4.5。

到了10月，FeltSteam再一次表示，一个比GPT-4大100倍的模型即将问世。

GPT-5将在2024年年中，或在2024年第三季度发布。

最近BussinessInsider的报道称，知情人士透露，GPT-5或将在今年夏天发布。与FeltSteam预测的时间几乎吻合。

而Arrakis是GPT-5一个更强大的候选者，在多个领域具备人类水平的专业知识能力。

GPT-5不是AGI

不过，Arrakis并不符合Altman对AGI的定义，即解决「量子引力」的问题。

量子引力，又称量子重力，是描述对重力场进行量子化的理论，属于万有理论之一隅；主要尝试结合广义相对论与量子力学，为当前物理学尚未解决的问题

但正如之前所说，Arrakis模型还是能够达到人类专家水平。

GPT-5和GPT-6都不是AGI

FeltSteam表示，传说中的AGI，是Arrakis以外的东西。

但是，为什么我们能在这么短的时间里，训练出一个125万亿参数的模型呢？

理论上来说，如果训一个1.75万亿参数模型需要4-5个月，那么如果训练一个大百倍的模型，应该需要几十年。

（目前已知，GPT-4在A100集群上训了100天，但是在训练之后，OpenAI又花了几个月时间对它微调和对齐。）

显然，要训125万亿参数的模型，不仅要投入原始计算资源，还要显著提高计算效率。

用90%合成数据训练

另一个比较值得关注的信息是，据称Arrakis去年训练的数据集中约90%是合成数据。

此前，外媒报道称：

Ilya Sutskever的突破让OpenAI克服了在获取高质量数据以训练新模型方面的限制，而这正是开发下一代模型的主要障碍。这项研究涉及使用计算机生成的数据，而不是真实世界的数据，如从互联网上提取的文本或图像来训练新模型。

FeltSteam认为，OpenAI正遇到了扩展（scaling）的难题，因为仅仅扩展注意力和模型参数是远远不够的。

目前，GPT-4的训练已经穷尽了整个互联网的数据，还需要进行强化学习，甚至更多的数据。

另外，Arrakis还是一个非常出色的自主智能体。

所有关于OpenAI项目信息汇总目录一览表。

十万个H100训GPT-6，被电力卡脖子

就在以上的爆料帖中，有一种说法是，GPT-6将于2025年发布。

而就在爆料微软工程师对话的帖子中，也再次证实：微软正用10万个H100来帮OpenAI训练GPT-6！

有网友算了一下，如果十万个H100同时开启，功耗将达到70兆瓦，电网肯定撑不住。

而熟悉电力行业的网友说，一般大型电厂的输出功率将达到2000兆瓦，100兆瓦的负载其实并不大。但是突然在电网中增加100兆瓦的负载肯定会让电网系统出问题。

核能也许是唯一的办法了，电力短缺将直接限制未来GPU的发展。

此前，ChatGPT每天耗电已超50万千瓦时，登上了热搜，足见AI「吃电」非常凶猛。

根据波士顿咨询集团的分析，到2030年，数据中心的用电量预计将增加两倍，相当于为大约4000万美国家庭供电所需的电力量

没想到，马斯克预言的由AI导致的电力短缺，这么快就卡住AGI的脖子了。

马斯克：「现在AI对算力的需求差不多每半年就会增加10倍，马上会超过宇宙的质量。芯片短缺缓解后，马上就会出现电力短缺。如果电网输出100-300千伏的电压，然后必须一路降压至6伏，未来会出现变压器短缺」。

包括Sam Altman在内的越来越多的AI行业大佬表示，AI的第一性原理，最重要的部分就是能源和智能的转化率的问题。

而人工智能是能源的无底洞，AI未来将会被能源卡脖子。

因为Transformer本质上不是一个能效很高的算法，所以在未来，能源将会是困扰AI发展的一个大问题。

对此，网友们表示，长期看好中国基建。

而在Altman看来，满足AI飙升能源需求的最有效方法，就是核聚变。

为此，他本人就在核聚变上投资了真金白银的数亿美元。

没有突破，就没有办法到达那里，我们需要核聚变。

然而，真要达成核聚变，却没那么快。

英国曼彻斯特大学核聚变研究员Aneeqa Khan表示，“在地球上重建太阳中心的条件是一个巨大的挑战”，可能要到本世纪下半叶才能准备就绪。

「核聚变已经为时已晚，无法应对气候危机。在短期内，我们可利用的是现有的低碳技术，比如裂变和可再生能源」。

国际能源署（IEA）最近的一项分析计算出，数据中心、某货和人工智能的电力消耗在未来两年内可能会翻一番。2022年，它们约占全球电力需求的2%。同时AI的需求将呈指数级增长，在2023年至2026年间至少增长10倍

此外，除了电力的限制之外，网友还继续脑洞大开，认为散热也将成为一个问题。🐶

10万块H100还会带来散热和空间堆叠的问题，其实最近3年这些问题一直都存在，未来还会越来越严重。

网友进一步调侃到，未来加拿大会成为AI大国，因为他们有取之不尽的寒冷且干燥的空气！这些在AI时代将会是宝贵的自然资源。

参考资料：

https://x.com/ai_for_success/status/1772701538705617167?s=20

https://twitter.com/ai_for_success/status/1772492362872168656?t=VDn6nXceeqOAuRZYi58vgA&s=19

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

震惊！信用卡刷爆100万后跑路回国，华人发帖炫耀晒操作：给美国一记重拳！山西一奔驰车主被曝2次碾压孩子后驶离，警方回应雷军回应华为“截胡”小米汽车；12306被质疑纵容买长乘短 | 金错刀日评 GPT 《扫花游 - 听雪》微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了 iPhone 16被爆256G起售？还会取消实体按键......AI早知道｜ChatGPT灰度测试多GPTs协同；新Bard逆袭GPT-4；百川智能发布Baichuan3 健身人不注意这些，训练等于白练….2024世界年轻大学排名发布，英国失业率上升，OpenAI推出GPT-4o 《丝路之约》&《牧马城市》GPT-4调教指令揭秘，OpenAI又「Open」了一回！网友在线追问GPT-5 最强开源大模型Llama 3来了！4000亿参数狙击GPT-4，训练数据达Llama 2七倍重磅｜信用卡刷爆100万后跑路回国！中国留学生“网晒”发声……OpenAI劲敌出手！Claude 3正式发布，超越GPT-4，一口气读15万单词 Meta加速抛弃英伟达？今年将部署自研推理芯片，训练芯片也在路上 OpenAI一夜干翻语音助手！GPT-4o模型强到恐怖，ChatGPT学会看屏幕，现实版Her来了微软曝光「AIPC」笔记本，电脑厂商跟进；GPT-4o需求高，OpenAI收入暴涨；裁员后，理想推迟纯电SUV发布｜极客早知道 OpenAI CEO Sam Altman斯坦福闭门会！GPT-5将远超GPT-4！OpenAI再压谷歌一头，最强模型GPT-4o免费发布，语言对话媲美人类反应我特别想收养这个孩子浓人，nèng死淡人 IEEE“封杀”计算机视觉女神；微软被曝1000亿AI超算计划；OpenAI首个亚洲基地本月启动丨AIGC大事日报微软发布新AI PC全家桶，支持GPT-4o/苹果发布更新修复照片复现问题/ChatGPT 语音酷似「寡姐」，本人回应 Meta首发「变色龙」挑战GPT-4o，34B参数引领多模态革命！10万亿token训练刷新SOTA 传微软OpenAI领投人形机器人；OpenAI一键调用GPTs功能上线；年度大模型评测榜单公布丨AIGC大事日报 ICML 2024 | 脱离LoRA架构，训练参数大幅减少，新型傅立叶微调来了 OpenAI CEO 称 iPhone 是最伟大的技术产品/特斯拉将斥资 5 亿美元建设充电网络/前暴雪总裁喊话微软 Xbox OpenAI CEO称GPT-5发布前会发一批新产品；Airbnb前高管将加入OpenAI担任高管丨AIGC日报腾讯研究院发布业界首份行业大模型调研报告；被曝2025年量产AI芯片并获软银支持，Arm回应丨AIGC日报 hé bàng？hé bèng？逼近GPT-4的新模型发布！「欧洲版OpenAI 」联手微软，却被质疑违背初心微软一夜干翻苹果Mac！GPT-4o装进全家桶，微软把全世界PC都AI了 OpenAI爆炸更新：GPT-4免费了！新模型GPT-4o发布，视觉、语音能力大幅增强，速度起飞，API打骨折【七律】銀婚贈友人逛台北的年货大街（多图）

热点事件追踪