Redian新闻
>
GPT-3 计划开源!Sam Altman 自曝急缺 GPU,GPT-4 多模态能力明年开放

GPT-3 计划开源!Sam Altman 自曝急缺 GPU,GPT-4 多模态能力明年开放

公众号新闻

推荐关注↓

转自:新智元

【导读】没想到,OpenAI短期工作无法推进,都是GPU太缺了!

听证会之后,Sam Altman带着团队在欧洲开启了「旅行」。

而在最近的一次访谈中,Altman也没有藏着掖着,自曝自家AI的一切进展,全得等GPU跟上了再说。

他讨论了OpenAI的API,以及产品计划,引起了许多人的关注。

许多网友纷纷表示,我喜欢Altman的坦诚。

值得一提的是,GPT-4的多模态能力,2024年应该大部分Plus用户就能上手了,前提还是有足够GPU才行。

微软老大哥斥资12亿美元给OpenAI建的超算,还远远无法满足GPT-4运行时所需的算力。毕竟,GPT-4参数据称有100万亿。

另外,Altman还透露,GPT-3也在OpenAI的开源计划之中。

不知道是不是这次采访内容透露了太多OpenAI的「机密」,源文稿目前已被删除,快点码了。

划重点


最新访谈,是来自AI开发平台Humanloop的首席执行官Raza Habib主持,采访了Altman以及其他20位开发人员。

这次讨论涉及到实际的开发者问题,以及与OpenAI的使命和AI的社会影响相关的更大的问题。

以下是关键要点:

1. OpenAI急缺GPU

2. OpenAI的近期路线图:GPT-4多模态2024年开放

3. 通过API访问ChatGPT插件近期不会发布

4. OpenAI只做ChatGPT这一「杀手级应用」,目标是让ChatGPT成为一个超级智能的工作助手

5. GPT-3在开源计划中

6. 模型性能的缩放法则继续有效

接下来,将从6大点介绍Sam Altman究竟说了啥。

OpenAI目前严重依赖GPU


采访的一切话题都是围绕,「OpenAI太缺GPU了」。

这已经拖延了他们许多的短期计划。

目前,OpenAI的许多客户都在抱怨API的可靠性和速度。Sam Altman解释道,主要还是GPU太缺了。

OpenAI是英伟达DGX-1超算首位客户

至于,支持32k tokens的上下文长度还不能推出给更多的人。

由于OpenAI还没有克服技术上的障碍,看起来他们似乎今年就会有支持100k-1M tokens的上下文,但需要在研究上取得突破。

微调(Fine-Tuning)API也目前受到GPU可用性的限制。

OpenAI还没有使用像Adapters或LoRa这样的高效微调方法,因此微调对于运行和管理来说是非常计算密集型的。

不过,未来他们将对微调提供更好的支持。甚至,OpenAI可能会托管一个社区贡献的模型市场。

最后,专用容量提供也受到GPU可用性的限制。

今年年初,网友爆出OpenAI正在悄悄推出一个新的开发者平台Foundry,让客户在专用容量上运行该公司的新机器学习模型。

这一产品就是「为运行较大工作负载的尖端客户设计」。要使用这项服务,客户必须愿意预付$100k的费用。

然而,从透露的图片信息可以看出,实例并不便宜。

运行GPT-3.5的轻量级版本,3个月的委托将花费78,000美元,一年将花费264,000美元。

从另一侧面也可以看出,GPU消耗价格不菲。

OpenAI近期路线图


Altman分享了OpenAI API的暂定近期路线图:

2023:

· 又快又便宜的 GPT-4ーー这是OpenAI的首要任务。

总的来说,OpenAI的目标是,尽可能地降低「智能成本」。因此他们将努力继续降低 API 的成本。

· 更长的上下文窗口ーー在不久的将来,上下文窗口可能支持高达100万个tokens。

· 微调 API——微调API将扩展到最新的模型,但具体的形式将取决于开发人员真正想要的是什么。

· 有记忆的API ーー目前大部分token被浪费在上文的传输中,将来会有一个能够记住对话历史的API版本。

2024:

· 多模态能力ーーGPT-4发布时曾演示了强大的多模态能力,但是在GPU得到满足之前,这一功能还无法拓展到所有人。

插件「没有 PMF」,短期内不会出现在API中

许多开发者对通过API访问ChatGPT插件非常感兴趣,但Sam表示这些插件不会很快发布。

「除了Browsing外,插件系统还没有找到PMF。」

他还指出,很多人想把他们的产品放到ChatGPT里,但实际上他们真正需要的是把ChatGPT放到他们的产品里。

除了ChatGPT,OpenAI不会发布更多产品


OpenAI的每一次动作,都让开发者们抖三抖。

不少开发人员表示,OpenAI可能发布与他们竞争的产品的时候,对使用OpenAI API构建应用感到紧张。

而Altman表示,OpenAI不会在ChatGPT之外发布更多的产品。

在他看来,伟大的公司有一个「杀手级应用」,ChatGPT就是要做这个创纪录的应用。

ChatGPT的愿景是成为一个超级智能的工作助理。OpenAI不会触及到更多其他GPT的用例。

监管是必要的,但开源也是必要的


虽然Altman呼吁对未来模型进行监管,但他并不认为现有的模型是危险的。

他认为,监管或禁止现有模型将是一个巨大的错误。

采访中,他重申了自己对开源重要性的信念,并表示OpenAI正在考虑将GPT-3开源。

而现在,OpenAI还没有开源的部分原因是,他对有多少个人和公司有能力托管,和提供大模型表示怀疑。

模型性能「缩放法则」仍有效


近来,许多文章声称,巨型人工智能模型的时代已经结束。然而,并没有准确反应Altman原意。

OpenAI的内部数据表明,模型性能的缩放法则(scaling laws)仍然有效,让模型变大将继续产生性能。

不过,缩放的速度不能维持,因为OpenAI在短短几年内已经将模型扩大了数百万倍,未来这样做将不可持续。

这并不意味着OpenAI不会继续尝试使模型更大,只是意味着它们可能每年只会增加1倍/2倍,而不是增加多个数量级。缩放法则继续有效的事实对AGI开发的时间线有重要的影响。

缩放假设是我们可能已经有了构建AGI所需的大部分部件,剩下的大部分工作将是将现有的方法扩展到更大的模型和更大的数据集。

如果缩放的时代结束了,那么我们可能应该预期AGI会更远。缩放法则继续有效强烈暗示了实现AGI时间线会变短。

网友热评


有网友调侃道,

OpenAI:必须通过法规来保护我们的护城河。还是OpenAI:Meta在我们的护城河里撒尿,让我们也暗示一下我们的模型要开源吧。

还有人称,如果GPT-3真的开源了,像LLMa一样,需要大约5天的时间在M1芯片上就能运行了。

社区开发人员能够帮OpenAI解决GPU瓶颈,前提是他们开源模型。没几天,开发者们就能让其运行在CPU和边缘设备。

GPU短缺一事,有人认为是OpenAI资金链出了问题,买不起。

然而还有人称,明显是缺乏供应。除非芯片制造业发生革命,否则相对于消费GPU来说,可能总是会出现供应不足的情况。

还有网友怀疑,英伟达的价值还是被低估?计算需求的阶梯式变化可能持续数年...

英伟达刚刚加入万亿美元俱乐部,这样说来,无限的算力需求或许会成就一个世界超越2万亿美元的芯片厂。

参考资料:
https://humanloop.com/blog/openai-plans
https://news.ycombinator.com/item?id=36141544


- EOF -




推荐阅读  点击标题可跳转

0、极客专属:几十款程序员秒懂的T恤/卫衣

1、全球首个开源“福利姬”诞生:自愿共享私密数据,方便网友制作 AI 擦边图

2、本周最火 AutoGPT!GitHub3.6万+标星,解决复杂任务全程无需人类插手

3、三星被曝因 ChatGPT 泄露芯片机密!韩媒惊呼数据“原封不动”直传美国,软银已禁止员工使用


关注「程序员的那些事」加星标,不错过圈内事

点赞和在看就是最大的支持❤️

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ChatGPT路线图曝光,预计明年公开多模态功能清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力我和大海有个约——清明祭父有感(2023)𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~“智力”下降!研究报告称GPT-4能力明显下降开源多模态大模型哪家强?TOP12榜单来了,GitHub揽获2.2k+星多模态大语言模型综述来啦!一文带你理清多模态关键技术2033年:我们的世界 (下)微软提出CoDi:开创性多模态扩散生成模型,实现4种模态任意输入输出让ChatGPT调用10万+开源AI模型!HuggingFace新功能爆火:大模型可随取随用多模态AI工具ChatGPT平替「小羊驼」Mac可跑!2行代码单GPU,UC伯克利再发70亿参数开源模型【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】七绝 孟郊 (通韵)Movie name: D33P WAT3R马斯克将自研AI芯片:类似GPU,但不是GPU率先开放语音、视频等多模态对话能力,这家中国公司又比OpenAI走快了一步Sam's Club这个泡面什么来历?已经炒到2000元一桶了,真那么好吃吗哈佛访校记更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作多模态如何自监督?爱丁堡等最新「自监督多模态学习」综述:目标函数、数据对齐和模型架构GPT-3计划开源!Sam Altman自曝急缺GPU,GPT-4多模态能力明年开放第三届 冇(Mǎo)国际青年影像周 开始征片啦!中文多模态模型问世!IDPChat生成图像文字,只需5步+单GPUSam’s club La Mer $100 off最高25000美元云资源!AI 超新星计划开启|Z Events腾讯AI Lab发布多模态指令调优语言模型,支持图像、视频等四种不同模态对OpenAI重拳出击!美国政府出手「开源」ChatGPT,Altman惊慌连发3推赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChatDPU与智能网卡技术公开课上新!三位技术大牛主讲开源DPU、内生安全智能网卡与DPU云化裸金属微软开源多模态聊天机器人 Visual ChatGPTSam Altman谈OpenAI:面临GPU短缺恐慌,GPT-3或将开源智源Emu开源!超越DeepMind,刷新8项SOTA,首个「多模态-to-多模态」全能高手OpenAI创始人:面临GPU短缺恐慌,GPT-3或将开源!从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统为多模态LLM指明方向,邱锡鹏团队提出具有内生跨模态能力的SpeechGPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。