工程与产品的胜利,深度剖析ChatGPT和聪明地设计基础架构
机器之心转载
来源:Suits and Hoodies
这里转载一篇深度剖析ChatGPT成功的一篇好文章:ChatGPT 实际上并不是普通人眼中的「黑科技」,而是持续开放科研的产物,是工程与产品的胜利。它将促使Infrastructure成为最大的赢家。
ChatGPT 并不是黑科技,是持续开放科研的产物。 ChatGPT 是工程、产品的胜利。 ChatGPT 不会让人失业,反而会带来更多的机会。 Infrastructure 会是这一场仗当中的赢家,但是要聪明地设计Infra。
Starting with a set of labeler-written prompts and prompts submitted through the OpenAI API, we collect a dataset of labeler demonstrations. of the desired model behavior.
怎么把计算,存储,网络,从物理资源变成虚拟的概念,“批发转零售”; 如何在这种虚拟环境下把利用率做上去,或者说超卖; 怎么更加容易地部署软件,做复杂软件的免运维(比如说,容灾、高可用)等等,不一而足。
并不要求特别强的虚拟化。一般训练会“独占”物理机,除了简单的例如建立虚拟网络并且转发包之外,并没有太强的虚拟化需求。 需要很高性能和带宽的存储和网络。例如,网络经常需要几百 G 以上的 RDMA 带宽连接,而不是常见的云服务器几 G 到几十 G 的带宽。 对于高可用并没有很强的要求,因为本身很多离线计算的任务,不涉及到容灾等问题。 没有过度复杂的调度和机器级别的容灾。因为机器本身的故障率并不很高(否则 GPU 运维团队就该去看了),同时训练本身经常以分钟级别来做 checkpointing,在有故障的时候可以重启整个任务从前一个 checkpoint 恢复。
The biggest lesson that can be read from 70 years of AI research is that general methods that leverage computation are ultimately the most effective, and by a large margin. Richard Sutton: "The Bitter Lesson"
题图: Unsplash
https://unsplash.com/@andyadcon
直升机图: Stanford University
蜡纸图: Taobao
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章