摩尔线程商业化初见成果，全功能GPU才是最优解？

2023-06-07 07:06

导语

国内GPU芯片创业的热潮进入行业下半场，应用落地将成为检验各家技术创新的试金石。

随着ChatGPT这样的大模型应用的火爆，再次凸显了GPU的重要性和巨大潜力。新时代下，行业到底需要怎样一颗GPU？面对未来大规模的计算量，GPU芯片应该怎样发展：是scale up还是scale out？英伟达所打造的CUDA生态坚不可摧，国产GPU厂商又该如何突破？在生成式AI这样极具潜力的未来市场中，国产厂商该如何抓住浪潮？

在摩尔线程举办的2023夏季发布会，该公司围绕数字办公、娱乐与创作、AI与云计算以及元宇宙等GPU重要应用场景，宣布了一系列新产品、技术更新以及应用场景中的突破。伴随着摩尔线程的全功能GPU迎来了商业化落地的新阶段，这些疑问也顺藤摸瓜得到了一定的解答。

全功能GPU是最优解？

在摩尔线程创始人兼CEO张建中看来，现在很多的新型应用、创新型应用如AIGC、数字人、元宇宙里的3D图象/图形生成、自动驾驶、机器人、数字孪生等，都是与AI+图形+元宇宙这个场景相关的。所有的AI应用最后落地给到用户的时候，最终呈现出的是多模态化应用场景，一定是图像、图形，而不只是文字。就像电脑的发展一样，最早电脑操作系统是以DOS文字为主，后来变成图形界面最后变成3D。AI也是一样，所以说最关键就是全功能GPU。

“为什么很多用户会喜欢用全功能。因为不能限制用户，今天干这个只能干这个，不能换一个代码不能用，用户肯定不愿意投。如果GPU放在云里面、大的集群里面，这个投资很贵，一投就是好几个亿，如果投进去这么多钱，用户只能做一个应用，那成本非常贵，但如果可以做100甚至1000个应用，分摊下来成本自然就低了。所以从规模效应讲，通用性比专用性更有价值。”

全功能的GPU虽然可能贵一些，但是它可以处理多种应用，利用率高。相比较而言，ASIC干一个事效率非常高，但是干完就处于闲置状态。对于超算中心来说，90%的利用率都不存在，这是极其浪费成本的做法，超算算一次差不多要10亿，如果是100%的利用率，成本平摊后将大幅降低成本。因此，重复利用率、整个资源率对于大型基建基础设施来讲非常重要。

通用性的好处还在于打开了很多开发者的创造力。张建中解释道，例如，如果你使用英伟达芯片或我们的全功能GPU，你会发现你今天实现了某种功能，而明天你又想出一些新的应用。这时你无需购买新设备，使用现有的设备就可以实现，这样既省钱又方便。这对于企业的竞争力来说是非常重要的，如果我们两个都是创业公司，刚开始我们的大型语言模型可能是一样的。然而，过几天他也能运行数字人、元宇宙、数字孪生等应用，而我却需要重新购买新设备。本来我可能只需要投资一亿就能完成目标，但后来又不得不再投入两三个亿，结果发现开发代码的能力也跟不上。最终，他遥遥领先，而我几乎无法与之竞争。

数字办公和游戏，撬开国内两大GPU商用大门

凭借全功能GPU的加持，摩尔线程现在正在国内数字办公和游戏两大GPU应用场景中取得商用进展和突破。

在国产GPU应用需求方面，张建中表示，目前需求更多是在数字办公方面，大家都希望办公体验能更好一点、希望速度更快一点。但是国产各种CPU与操作系统版本的组合上百种，适配的难度与复杂度极高。不同CPU之间的差异也较大，要确保GPU能支持不同CPU，还要保障这些不同CPU都能有很好的稳定性和可靠性，不是易事。除了硬件之外，还非常考验GPU芯片企业的软件能力、产品品质、产品保障能力、企业级服务能力。

在国内数字化办公领域，摩尔线程通过率先支持OpenGL 4.0和Vulkan 1.3的完整功能、驱动软件新增DKMS技术支持来快速适配不同操作系统内核以及驱动的不断优化。目前已经陆续完成了10余家ODM和18家OEM厂商的产品导入，共同推出了30余款PC机型，应用于电信、金融、能源等数字经济关键行业。

随着行业数字化转型的加速，企业对上云、用云的需求日益增长，传统的云桌面方案仅依靠CPU已无法满足新型办公和富媒体类应用的需求。为此，摩尔线程推出了云桌面产品MT vGPU 2.1和MCCX VDI云桌面一体机。目前，摩尔线程已经与包括天翼云电脑、移动云电脑等在内的10余家客户的产品完成适配，并与深信服、新华三信息、华云、酷栈和庭宇科技完成了产品导入。

游戏是摩尔线程非常看重的一大应用场景。在此次大会上，摩尔线程宣布，即将于6月下旬发布基于DirectX 11的社区版驱动，解锁包括《原神》和《DOTA2》等备受瞩目的3A级游戏作品，进一步为显卡玩家提供最新功能体验。同时，摩尔线程在“摩卡玩家”社区启动“Alpha行动”，召集更多玩家对DirectX 11社区版驱动的使用和反馈，以加速驱动的迭代速度。摩尔线程也是首个真正支持DirectX 11游戏的中国GPU公司。

与此同时，摩尔线程还发布了全新游戏显卡MTT S70及整机产品“智娱摩方”，其中“智娱摩方”是业界首个基于国产GPU、集游戏和生成式AI应用于一体的智能终端设备，搭载MTT S80和MTT S70两款全功能GPU显卡。

总结摩尔线程的产品差异化，有这么几点：一是显卡中集成了各种最新的AI应用。此次推出的智娱魔方就是一个尝试；二是支持跨平台应用，包括Windows、Linux等开发平台的支持，应用领域广泛；三是适配国产游戏引擎，对于国内游戏应用，摩尔线程的适配将可能比国外的产品还要好；四，集成很多特色应用，如物理引擎AlphaCore，能实现不同的效果和体验，AlphaCore的试用版本已开放下载；五、编解码能力比一般游戏卡编解码能力强很多。此外还有很多不明显的差异化和增值服务的能力。

MUSA架构平滑迁移CUDA

硬件健全，软件兼容，是摩尔线程做GPU的核心理念。摩尔线程去年发布了MUSA元计算统一系统架构，包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。

熟悉英伟达GPU的都知道，英伟达的CUDA生态是其强大的护城河。“但从头开始创造一个生态系统是漫长的过程，生态系统不是说想创造就创造，要看整体上生态系统环境和影响，既然已经有这样的生态，你要想重新弄一个生态颠覆这个生态，这个事情有没有必要。对于一个新世界来说，融入这个世界是让你快速发展的最好策略。”他接着指出，“我们要做到的是为客户省时间，所以不要让客户学习新东西，不要让客户为难，不要制造障碍。你给它门槛越高，那你客户流进来客户越少，如果门槛是平的，没有门槛，就自动流过来。”

会上，摩尔线程推出MUSA Toolkit 1.0软件工具包和“MUSIFY”代码移植工具。其中MUSIFY可快速将现有的CUDA程序迁移至MUSA，零成本完成CUDA代码自动移植。一般的大模型迁移到摩尔线程MUSA只需一天之内。

生成式AI，国内创业空间和机会都很大

生成式AI的发展潜力行业已达成共识，这将颠覆许多传统软件应用开发方式。张建中表示，这个领域有许多成功的机会，并且在许多行业领域都有专业支持。因此，不可能只有一个模型能够统一所有需求，而是需要多个模型。这就是为什么国外有那么多创业公司从事这个领域。而且国外的模型不一定适用于中国市场，在国内，生成式AI创业的空间和机会都非常广阔。

“对于我们来讲，当然是更好的机会。不管做训练、推理，大家都用更多算力，如果是只有一家来供应的话，供应的量将有限。再者，许多创业公司对金钱成本的控制都有需求，如果我们能够提供好的方案且具有性价比的话，这个就是我们的机会。”张建中补充道。

在AIGC内容创作方面，摩尔线程的全功能GPU依然可以释放潜力。摩笔马良是摩尔线程推出的软硬件一体化的AIGC内容创作平台，目前内测已上线。

摩尔线程做像摩笔马良和智娱魔方这种偏向应用层的产品，是为了给客户打样，启发用户利用摩尔线程的全功能GPU可以做哪些比较有意义事情。“我们模型是我们在自己的平台上训练的，我们不需要依靠任何人，就可以完成这些事情，所以我们既然能做，那么我们相信客户也可以做。”

在谈到诸如生成式AI这样此前未知应用的发明和探索上，张建中表示，对于企业而言，要想追上或者超越行业，必须要有一个稳定可靠合作伙伴才行。GPT4现在是已知世界，未知世界还很广，探索未知世界你得有好的合作伙伴，能力强、实力强，有硬件能力、软件能力、有算法水平。

而面对未来大规模的工作量需求，如今各大芯片巨头都在布局大型计算机体系结构。谈到在这方面的发展方向和应对之策时，张建中指出，对于提升性能来说，效率和管理能力比单个芯片的计算能力更为重要。就像特斯拉的电池并不是由一个大型电池组成，而是由许多小电池组合而成的。GPU也将是如此，没有人能制造一个巨大的GPU来运行算法。但是却可以通过组合多个GPU来完成任务，并且提高效率和管理能力。因此，这给我们带来了启示，我们不必仅仅追求规模的扩大（scale up），而是要追求规模的扩展（scale out）。

“这也正是我们的优势，GPU里面有成千上万个核心。将多个GPU组合在一起的原理也是类似的，其中涉及到空间、存储、网络和调度等各方面的能力，这些正是GPU的核心所在。”

公司发展进程，“光速”，但还不够快

对于一家创立仅2年多的GPU芯片企业，摩尔线程的发展速度在业内算快的。大家会有疑问他们是如何做到的？对此，张建中分享到：“首先要勤奋，干什么事情动作要快，不仅跑的快还要更努力；再一个就是专业和有经验的人才，团队都是做了几十年的经验丰富专家、学家，我相信这个速度会比初学者快很多。”

张建中表示“公司近些年来的发展和我预期一样，我们公司有一个文化叫做光速，就算是这样，我们还觉得不够快。因为世界变化太快，有些东西比我们想象的发展得快，政策上的变化、技术爆发都比我们想象的快。现在GPU的发展依然非常快。一个企业的成功，除了需要对过去经验的积累，还要对未来有正确的判断，对市场发展前景要有很好的判断力。虽然我们已经远远超出投资人对我们的预期，不过我们自己感觉和国际巨头还是差的蛮远。”

“当然最重要的是，要有长期发展目标，想明白到底想干什么，所以公司定位很重要。我们从创业之初就谈论"元计算"，并致力于构建一个包含人、场景和内容等要素的元宇宙计算平台，同时实现智能化和智慧化。”他们的目标是将人工智能、3D图形、云原生和集群管理相结合，以提供无限的云端GPU计算能力，为元宇宙的各种不同应用提供服务。“我们相信，我们现在所做的正是未来所需要的。”张建中表示。

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3425期内容，欢迎关注。