当前位置:首页 > 虚拟化 > 正文

华为虚拟化超融合


一、华为超融合基于什么开发超融合发展
与集群化基础设施相比,华为超融合系统以硬件集成为基础,在软件层面进行优化,将合适的基础设施盒子变成资源池,提供计算和存储海量数据的能力。数据表轻松便捷地直接部署超融合系统。
华为FusionCube是集计算、存储、网络、虚拟化、管理于一体的超融合基础设施,具有高性能、低时延、深度计算引擎快速部署和融合等特点。它支持行业标准数据库和行业虚拟化软件。
华为FusionCube遵循开放架构标准,将刀片服务器、存储和分布式网络交换机集成在12U机箱内,并预集成虚拟平台和云管理;投资于扩大需求和线性;
二、虚拟化/超融合中的GPU直通与vGPU

虚拟化和超融合领域的GPU革命:直通与vGPU之战


随着技术的快速发展,GPU已经从图形处理AI和大数据的专属领域转移到了GPU领域。数据是区块链计算的基石。在现代企业数据中心中,GPU的并行计算能力在图像处理、AI训练和推理,甚至高性能计算(HPC)任务中发挥着关键作用。例如,NVIDIA的CUDA平台在性能方面表现出惊人的改进,例如Xeon8180不带GPU。在STAC-2Benchmark中,服务器性能仅为GPU服务器的1/8.9,具有低延迟和更高的能效,挑战CPU的传统地位。


在虚拟化/超融合领域,GPU利用策略主要分为两种模式:GPU直通和vGPU。


GPU直通(PCIePass-through):该方式几乎没有性能损失(小于5%),但不支持共享多台机器虚拟,可能需要额外的GPU。不支持地图和在线迁移,适合性能要求极高的场景。
vGPU(虚拟GPU):利用GPU资源分割技术,如NVIDIA的Time-sliced和MIG,允许多个虚拟机并行运行,但管理复杂度增加并涉及显存分配。NVIDIA的vGPUA、B、C和Q系列专为不同的工作负载而设计。例如,A系列针对vCSV进行了优化,但热迁移存在限制,这可能会影响服务续性。

我们以NVIDIA的A40为例。它提供多种vGPU解决方案来适应不同用户的需求,包括虚拟桌面、AI训练、虚拟桌面和虚拟应用程序。使用vGPU需要NVIDIAGRID软件许可证,硬件要求包括IOMMU兼容处理器(例如AMD、Intel或海光/鲲鹏SMMU)和可能的SR-IOV功能。选择正确的vGPU系列(例如A系列与vCS、C系列与vPC)至关重要,但必须谨慎管理实时迁移的限制。


许可证和系列匹配:
A系列:vCS
C系列:vPC
B系列:vWS
Q系列、C系列、B系列:vWS
硬件要求:
支持IOMMU的CPU
可能需要启用SR-IOV
限制:
实时迁移限制
直接迁移GPU和vGPU虚拟机可能会中断服务

SMTXOS5.1更新引入了对GPU直通和vGPU的支持,特别适合实时渲染和AI训练。用户可以通过CloudTower轻松配置它。目前支持的NVIDIA显卡包括T4、V100和A30,vGPU分割模式根据具体GPU型号特性而有所不同。要了解有关NVIDIA显卡的vGPU支持的更多信息,请参阅官方文档。


深入探讨CPU与GPU之战,以及如何在虚拟化环境中明智地选择和管理GPU资源,将为您的企业带来前所未有的计算性能。更多信息请参阅Intel的比较,以及详细的NVIDIATeslaV100应用性能指南和vGPU用户手册虚拟GPU类型参考。