Redian新闻
>
摩尔线程商业化初见成果,全功能GPU才是最优解?

摩尔线程商业化初见成果,全功能GPU才是最优解?

科技


导语



国内GPU芯片创业的热潮进入行业下半场,应用落地将成为检验各家技术创新的试金石。


随着ChatGPT这样的大模型应用的火爆,再次凸显了GPU的重要性和巨大潜力。新时代下,行业到底需要怎样一颗GPU?面对未来大规模的计算量,GPU芯片应该怎样发展:是scale up还是scale out?英伟达所打造的CUDA生态坚不可摧,国产GPU厂商又该如何突破?在生成式AI这样极具潜力的未来市场中,国产厂商该如何抓住浪潮?


在摩尔线程举办的2023夏季发布会,该公司围绕数字办公、娱乐与创作、AI与云计算以及元宇宙等GPU重要应用场景,宣布了一系列新产品、技术更新以及应用场景中的突破。伴随着摩尔线程的全功能GPU迎来了商业化落地的新阶段,这些疑问也顺藤摸瓜得到了一定的解答。


全功能GPU是最优解?


在摩尔线程创始人兼CEO张建中看来,现在很多的新型应用、创新型应用如AIGC、数字人、元宇宙里的3D图象/图形生成、自动驾驶、机器人、数字孪生等,都是与AI+图形+元宇宙这个场景相关的。所有的AI应用最后落地给到用户的时候,最终呈现出的是多模态化应用场景,一定是图像、图形,而不只是文字。就像电脑的发展一样,最早电脑操作系统是以DOS文字为主,后来变成图形界面最后变成3D。AI也是一样,所以说最关键就是全功能GPU。


“为什么很多用户会喜欢用全功能。因为不能限制用户,今天干这个只能干这个,不能换一个代码不能用,用户肯定不愿意投。如果GPU放在云里面、大的集群里面,这个投资很贵,一投就是好几个亿,如果投进去这么多钱,用户只能做一个应用,那成本非常贵,但如果可以做100甚至1000个应用,分摊下来成本自然就低了。所以从规模效应讲,通用性比专用性更有价值。”


全功能的GPU虽然可能贵一些,但是它可以处理多种应用,利用率高。相比较而言,ASIC干一个事效率非常高,但是干完就处于闲置状态。对于超算中心来说,90%的利用率都不存在,这是极其浪费成本的做法,超算算一次差不多要10亿,如果是100%的利用率,成本平摊后将大幅降低成本。因此,重复利用率、整个资源率对于大型基建基础设施来讲非常重要。


通用性的好处还在于打开了很多开发者的创造力。张建中解释道,例如,如果你使用英伟达芯片或我们的全功能GPU,你会发现你今天实现了某种功能,而明天你又想出一些新的应用。这时你无需购买新设备,使用现有的设备就可以实现,这样既省钱又方便。这对于企业的竞争力来说是非常重要的,如果我们两个都是创业公司,刚开始我们的大型语言模型可能是一样的。然而,过几天他也能运行数字人、元宇宙、数字孪生等应用,而我却需要重新购买新设备。本来我可能只需要投资一亿就能完成目标,但后来又不得不再投入两三个亿,结果发现开发代码的能力也跟不上。最终,他遥遥领先,而我几乎无法与之竞争。


数字办公和游戏,撬开国内两大GPU商用大门


凭借全功能GPU的加持,摩尔线程现在正在国内数字办公和游戏两大GPU应用场景中取得商用进展和突破。


在国产GPU应用需求方面,张建中表示,目前需求更多是在数字办公方面,大家都希望办公体验能更好一点、希望速度更快一点。但是国产各种CPU与操作系统版本的组合上百种,适配的难度与复杂度极高。不同CPU之间的差异也较大,要确保GPU能支持不同CPU,还要保障这些不同CPU都能有很好的稳定性和可靠性,不是易事。除了硬件之外,还非常考验GPU芯片企业的软件能力、产品品质、产品保障能力、企业级服务能力。


在国内数字化办公领域,摩尔线程通过率先支持OpenGL 4.0和Vulkan 1.3的完整功能、驱动软件新增DKMS技术支持来快速适配不同操作系统内核以及驱动的不断优化。目前已经陆续完成了10余家ODM和18家OEM厂商的产品导入,共同推出了30余款PC机型,应用于电信、金融、能源等数字经济关键行业。



随着行业数字化转型的加速,企业对上云、用云的需求日益增长,传统的云桌面方案仅依靠CPU已无法满足新型办公和富媒体类应用的需求。为此,摩尔线程推出了云桌面产品MT vGPU 2.1和MCCX VDI云桌面一体机。目前,摩尔线程已经与包括天翼云电脑、移动云电脑等在内的10余家客户的产品完成适配,并与深信服、新华三信息、华云、酷栈和庭宇科技完成了产品导入。


游戏是摩尔线程非常看重的一大应用场景。在此次大会上,摩尔线程宣布,即将于6月下旬发布基于DirectX 11的社区版驱动,解锁包括《原神》和《DOTA2》等备受瞩目的3A级游戏作品,进一步为显卡玩家提供最新功能体验。同时,摩尔线程在“摩卡玩家”社区启动“Alpha行动”,召集更多玩家对DirectX 11社区版驱动的使用和反馈,以加速驱动的迭代速度。摩尔线程也是首个真正支持DirectX 11游戏的中国GPU公司。



与此同时,摩尔线程还发布了全新游戏显卡MTT S70及整机产品“智娱摩方”,其中“智娱摩方”是业界首个基于国产GPU、集游戏和生成式AI应用于一体的智能终端设备,搭载MTT S80和MTT S70两款全功能GPU显卡。



总结摩尔线程的产品差异化,有这么几点:一是显卡中集成了各种最新的AI应用。此次推出的智娱魔方就是一个尝试;二是支持跨平台应用,包括Windows、Linux等开发平台的支持,应用领域广泛;三是适配国产游戏引擎,对于国内游戏应用,摩尔线程的适配将可能比国外的产品还要好;四,集成很多特色应用,如物理引擎AlphaCore,能实现不同的效果和体验,AlphaCore的试用版本已开放下载;五、编解码能力比一般游戏卡编解码能力强很多。此外还有很多不明显的差异化和增值服务的能力。


MUSA架构平滑迁移CUDA


硬件健全,软件兼容,是摩尔线程做GPU的核心理念。摩尔线程去年发布了MUSA元计算统一系统架构,包括统一的编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。


熟悉英伟达GPU的都知道,英伟达的CUDA生态是其强大的护城河。“但从头开始创造一个生态系统是漫长的过程,生态系统不是说想创造就创造,要看整体上生态系统环境和影响,既然已经有这样的生态,你要想重新弄一个生态颠覆这个生态,这个事情有没有必要。对于一个新世界来说,融入这个世界是让你快速发展的最好策略。”他接着指出,“我们要做到的是为客户省时间,所以不要让客户学习新东西,不要让客户为难,不要制造障碍。你给它门槛越高,那你客户流进来客户越少,如果门槛是平的,没有门槛,就自动流过来。”


会上,摩尔线程推出MUSA Toolkit 1.0软件工具包和“MUSIFY”代码移植工具。其中MUSIFY可快速将现有的CUDA程序迁移至MUSA,零成本完成CUDA代码自动移植。一般的大模型迁移到摩尔线程MUSA只需一天之内。



生成式AI,国内创业空间和机会都很大


生成式AI的发展潜力行业已达成共识,这将颠覆许多传统软件应用开发方式。张建中表示,这个领域有许多成功的机会,并且在许多行业领域都有专业支持。因此,不可能只有一个模型能够统一所有需求,而是需要多个模型。这就是为什么国外有那么多创业公司从事这个领域。而且国外的模型不一定适用于中国市场,在国内,生成式AI创业的空间和机会都非常广阔。


“对于我们来讲,当然是更好的机会。不管做训练、推理,大家都用更多算力,如果是只有一家来供应的话,供应的量将有限。再者,许多创业公司对金钱成本的控制都有需求,如果我们能够提供好的方案且具有性价比的话,这个就是我们的机会。”张建中补充道。


在AIGC内容创作方面,摩尔线程的全功能GPU依然可以释放潜力。摩笔马良是摩尔线程推出的软硬件一体化的AIGC内容创作平台,目前内测已上线。


摩尔线程做像摩笔马良和智娱魔方这种偏向应用层的产品,是为了给客户打样,启发用户利用摩尔线程的全功能GPU可以做哪些比较有意义事情。“我们模型是我们在自己的平台上训练的,我们不需要依靠任何人,就可以完成这些事情,所以我们既然能做,那么我们相信客户也可以做。”


在谈到诸如生成式AI这样此前未知应用的发明和探索上,张建中表示,对于企业而言,要想追上或者超越行业,必须要有一个稳定可靠合作伙伴才行。GPT4现在是已知世界,未知世界还很广,探索未知世界你得有好的合作伙伴,能力强、实力强,有硬件能力、软件能力、有算法水平。


而面对未来大规模的工作量需求,如今各大芯片巨头都在布局大型计算机体系结构。谈到在这方面的发展方向和应对之策时,张建中指出,对于提升性能来说,效率和管理能力比单个芯片的计算能力更为重要。就像特斯拉的电池并不是由一个大型电池组成,而是由许多小电池组合而成的。GPU也将是如此,没有人能制造一个巨大的GPU来运行算法。但是却可以通过组合多个GPU来完成任务,并且提高效率和管理能力。因此,这给我们带来了启示,我们不必仅仅追求规模的扩大(scale up),而是要追求规模的扩展(scale out)。


“这也正是我们的优势,GPU里面有成千上万个核心。将多个GPU组合在一起的原理也是类似的,其中涉及到空间、存储、网络和调度等各方面的能力,这些正是GPU的核心所在。”


公司发展进程,“光速”,但还不够快


对于一家创立仅2年多的GPU芯片企业,摩尔线程的发展速度在业内算快的。大家会有疑问他们是如何做到的?对此,张建中分享到:“首先要勤奋,干什么事情动作要快,不仅跑的快还要更努力;再一个就是专业和有经验的人才,团队都是做了几十年的经验丰富专家、学家,我相信这个速度会比初学者快很多。”


张建中表示“公司近些年来的发展和我预期一样,我们公司有一个文化叫做光速,就算是这样,我们还觉得不够快。因为世界变化太快,有些东西比我们想象的发展得快,政策上的变化、技术爆发都比我们想象的快。现在GPU的发展依然非常快。一个企业的成功,除了需要对过去经验的积累,还要对未来有正确的判断,对市场发展前景要有很好的判断力。虽然我们已经远远超出投资人对我们的预期,不过我们自己感觉和国际巨头还是差的蛮远。”


“当然最重要的是,要有长期发展目标,想明白到底想干什么,所以公司定位很重要。我们从创业之初就谈论"元计算",并致力于构建一个包含人、场景和内容等要素的元宇宙计算平台,同时实现智能化和智慧化。”他们的目标是将人工智能、3D图形、云原生和集群管理相结合,以提供无限的云端GPU计算能力,为元宇宙的各种不同应用提供服务。“我们相信,我们现在所做的正是未来所需要的。”张建中表示。


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3425期内容,欢迎关注。

推荐阅读


无线充电,又行了?

这颗芯片,暗藏AI未来!

万字长文,说透光刻机


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
如何卖冰淇淋才是“最优解”?大变样!加拿大新版护照7月推出!多项高科技安全功能,内外皆美学![电脑] ThinkStation P360 Ultra 小机身全功耗CPU 开箱国产GPU重要应用场景迎来突破!摩尔线程发布重磅产品与创新解决方案同等性能降本50%?什么是AR-HUD规模上车方案的最优解You Say - Lauren Daigle寻找美《二》寻找美却并不见得是一种美德[电脑] 用攒机来回答两个问题:B760天选用13700k电压还高吗?RTX4080是4k高刷游戏的最优解?细数线程池的10个坑,面试线程不怕不怕啦马斯克将自研AI芯片:类似GPU,但不是GPU4位富豪因AI暴赚10000亿;贾跃亭就FF 91延迟交付致歉;工信部:支持L3及更高级别的自动驾驶功能商业化应用丨邦早报从根上理解Maven拉包原理,搞定Maven全功能LG 1.5米100W全功能数据线 14.9元;森马旗下冰丝长裤 39元不要和陌生人说话, 和爱上陌生人法拉盛严打无证摊贩初见成效!将在这设合法地点....故事介绍:劫尸记 (The Body-Snatcher by Robert Louis Stevenson)巨头ChatGPT大战陷败局,竟因嫌GPU太贵!Meta用CPU跑AI,点错科技树研究成果被对手抢先商业化!谷歌称将缩减AI论文发表数量,网友:谷歌不想再做“大冤种”了DPU与智能网卡技术公开课上新!三位技术大牛主讲开源DPU、内生安全智能网卡与DPU云化裸金属《最优解人生》:怎么花钱,才会不留遗憾?摩尔线程再推国产游戏显卡!能玩原神和DOTA2,大秀数字人生成技能留学澳洲 院校推荐 | 从迪肯学院到迪肯大学,这里有一个机会,让你加入最优,成为最优!探索“巡网融合”最优解 打开“老师傅们”的新地图工信部:支持有条件自动驾驶(L3级)功能商业化应用转载:资本主义之后是什么社会蔡崇信回归,阿里止损的最优解通用大模型不是万金油,什么才是解决产业问题的最优解?辣评-Weekly:科学普及不仅仅应该作为事业;核心器件的商业化,是商业航天的基础;美国公众对NASA未来太空发展的期望研究成果被对手抢先商业化!谷歌称将缩减 AI 论文发表数量,网友:谷歌种的树都被别人乘了凉,他们不想再做“大冤种”了遏制边境移民初见成效,拜登新规被联邦法官叫停!K3s vs K8s:轻量级和全功能的对决ICML 2023 | 究竟MAE与对比学习怎样结合才是最优的?ReCon来告诉你答案创业人生,诚实是最优解基于AI和NPU的Codec变革——VPU与NPU的协同创新组织变革的最优解,到底是什么?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。