Redian新闻
>
麒麟软件虚拟 GPU 方案 V2.0 发布,3D 渲染性能提升至 80% 以上

麒麟软件虚拟 GPU 方案 V2.0 发布,3D 渲染性能提升至 80% 以上

公众号新闻

来源:IT之家 作者:汪淼

近日,麒麟软件研发中心虚拟化技术研发团队推出虚拟 GPU 方案 V2.0,该方案采用 vhost-user-gpu、3D 渲染同步优化、基于动态数据的云桌面刷新等技术,将虚拟机 GPU 的 3D 渲染性能提升到后端 GPU 3D 渲染性能的 80% 以上
麒麟软件表示,该方案无需专业显卡支持,通过消费级显卡即可使虚拟机满足图像处理、平面设计、3D 建模以及游戏等场景的需求,同时可实现 1:N 的灵活性和隔离性,大大降低了用户使用成本。
附麒麟软件虚拟 GPU 方案 V2.0 版技术框图:

据介绍,随着云桌面技术的发展和广泛应用,用户在云桌面进行图像处理、平面设计、3D 建模以及游戏等场景需求增多,这对云桌面的图像渲染能力提出了越来越高的要求。
在 2022 年 5 月,麒麟软件基于开源 virtio-gpu 半虚拟化显卡技术和 api 转发方案,开发了自己的虚拟 GPU 方案 V1.0。该方案对 virtio-gpu 虚拟显卡进行了深度优化,在有后端 GPU 支持的情况下,可将 virtio-gpu 的渲染性能提升到后端 GPU 性能的 60%(采用 glmark2 渲染基准测试)。

然而,与 GPU 硬件虚拟化方案相比,麒麟软件虚拟 GPU 方案 V1.0 的渲染转发过程开销仍比较大,后端物理 GPU 没能得到充分利用,损失近 40% 的渲染性能。针对该问题,对虚拟 GPU 方案进一步升级优化,推出麒麟软件虚拟 GPU 方案 V2.0,使得渲染过程中的性能损耗降低到两成以内,3D 综合渲染性能可以达到后端 GPU 性能的八成以上

麒麟软件表示,GPU 方案 V2.0 采用新技术框架,使用 vhost-user-gpu 虚拟显卡(基于 vhost-user 技术实现)替换了 V1.0 方案采用的 virtio-gpu 虚拟显卡vhost-user-gpu 虚拟显卡无需经由宿主机内核 kvm 模块和用户态切换,可以通过共享内存直接与虚拟机进行数据面通信,减少了大量的用户态(vm exit 和 vm entry)切换开销,V1.0 版本额外开销更小,性能更好。
此外,GPU 方案 V2.0,还突破了渲染命令执行实时监听技术与快速命令反馈技术,在渲染命令执行过程中,实现实时监听,提升命令执行监听精确度,减少物理 GPU 的空闲等待;在命令执行完毕前,预先准备好反馈数据,提升反馈速度和减少反馈时间开销。实现了由完整桌面刷新改为动态区域刷新,即只刷新桌面显示数据有变化的区域,降低云桌面刷新时,读取物理 GPU 中未变化图像数据所造成的额外开销。

为验证方案效果,基于英特尔集显、AMD RX 550 以及英伟达 RTX 2060 三种不同厂商的显卡,以及 glmark2 和 gputest 两种不同的基准测试程序对 vhost-user-gpu 的 3d 渲染性能进行了测试,结果如下:
在 glmark2 基准测试下,vhost-user-gpu 在分别以三种不同类型的 GPU 作为后端渲染加速 GPU 的情况下,测试得分均达到甚至超过物理 GPU 的原始测试得分的 80%

在 gputest 基准测试下,对比 vhost-user-gpu 与物理 GPU 在 7 个不同测试场景下的得分,结果显示,在大多数情况下,优化后的 vhost-user-gpu 的性能同样可以达到物理 GPU 原始性能的 80% 以上。

此外,麒麟软件虚拟化 GPU 方案 V2.0 还进行了广泛的架构适配和显卡适配,在商用 x86、arm 架构下,采用主流显卡厂商 GPU 作为后端 GPU 时,该方案均能正常运行

END

官方站点:www.linuxprobe.com

Linux命令大全:www.linuxcool.com

刘遄老师QQ:5604215

Linux技术交流群:2636170

(新群,火热加群中……)

想要学习Linux系统的读者可以点击"阅读原文"按钮来了解书籍《Linux就该这么学》,同时也非常适合专业的运维人员阅读,成为辅助您工作的高价值工具书!


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
后门准确率降至3%,主任务性能几乎不变!华工JHU提出全新「联邦学习后门攻击识别」解决方案|ICCV2023MiniGPT-4升级到MiniGPT-v2了,不用GPT-4照样完成多模态任务中科加禾崔慧敏:AI芯片+编译器才是王道!性能提升2~3倍,将推出大模型推理引擎丨GACS 20234K画质3D合成视频不再卡成幻灯片,新方法将渲染速度提高了30多倍统信 UOS V20 专业版更新发布,修复部分机型联网后偶现自动断连等问题百纳米完胜7纳米?清华团队在该芯片领域实现新突破,芯片性能提升万倍Vite 5 正式发布,性能大幅提升囤 H100 的都成了大冤种!英伟达发布最新 AI 芯片 H200:性能提升 2 倍,成本下降 50%曼谷雨季从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型8卦时间(54)——今天谈谈傅科摆:Das Foucaultsche Pendel(1)一百五十六 考试Zen 4 提升最明显,AMD 四代移动 CPU 在 Linux 平台性能实测Python 3.12 正式发布:性能提升、no-GIL将在 3.13 提供清华光电计算新突破:芯片性能提升万倍,研究登顶Nature囤H100的都成了大冤种!英伟达发布最新AI芯片H200:性能提升2倍,成本下降50%旅美散记(23):登帝国大厦有感树莓派5来了!438元起售,CPU性能提高2-3倍单点端到端文本检测识别框架速度提升19倍!华科、华南理工等联合发布SPTS v2好家伙,3D软件不是这么用的……国产CPU里程碑!龙芯最强处理器、自研GPGPU来了,披露Tock“三剑客”只凭CPU/GPU性能换机的时代,过去了英特尔演示酷睿 Ultra 1 代笔记本:关闭 CPU / GPU 模块,使用 SoC 模块播放 1080p 视频科学家开发高性能计算方法,将高精度分子动力学模拟规模提升至170亿原子宸芯科技,「领跑」高性能车联网C-V2X芯片|年度好产品入围公示Bazel 7 发布:全新模块化依赖管理、无字节构建与多目标构建性能提升AMD推出锐龙8040系列APU,采用Zen4 CPU+RDNA3 GPU小米上线首款千元级3D打印机,同消费级3D打印机公司「胜马优创」合作发布|36氪首发GauHuman开源:基于Gaussian Splatting,高质量3D人体快速重建和实时渲染框架一百五十五 备考4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究10倍性能提升-SLS Prometheus 时序存储技术演进Blender 4.0 版本发布,引领了渲染升级的新趋势 | Linux 中国国产GPTs来了,基于智谱第4代大模型!模型性能均达GPT-4九成以上骁龙8 Gen 3处理器发布:CPU性能提升30%、GPU提升25%
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。