当前位置：首页 > 虚拟化 > 正文

华为虚拟化超融合

虚拟化
2024-04-22 21:03:10
6405

一、华为超融合基于什么开发超融合发展
与集群化基础设施相比，华为超融合系统以硬件集成为基础，在软件层面进行优化，将合适的基础设施盒子变成资源池，提供计算和存储海量数据的能力。数据表轻松便捷地直接部署超融合系统。
华为FusionCube是集计算、存储、网络、虚拟化、管理于一体的超融合基础设施，具有高性能、低时延、深度计算引擎快速部署和融合等特点。它支持行业标准数据库和行业虚拟化软件。
华为FusionCube遵循开放架构标准，将刀片服务器、存储和分布式网络交换机集成在12U机箱内，并预集成虚拟平台和云管理；投资于扩大需求和线性；

二、虚拟化/超融合中的GPU直通与vGPU

虚拟化和超融合领域的GPU革命：直通与vGPU之战

随着技术的快速发展，GPU已经从图形处理AI和大数据的专属领域转移到了GPU领域。数据是区块链计算的基石。在现代企业数据中心中，GPU的并行计算能力在图像处理、AI训练和推理，甚至高性能计算（HPC）任务中发挥着关键作用。例如，NVIDIA的CUDA平台在性能方面表现出惊人的改进，例如Xeon8180不带GPU。在STAC-2Benchmark中，服务器性能仅为GPU服务器的1/8.9，具有低延迟和更高的能效，挑战CPU的传统地位。

在虚拟化/超融合领域，GPU利用策略主要分为两种模式：GPU直通和vGPU。

GPU直通（PCIePass-through）：该方式几乎没有性能损失（小于5%），但不支持共享多台机器虚拟，可能需要额外的GPU。不支持地图和在线迁移，适合性能要求极高的场景。
vGPU（虚拟GPU）：利用GPU资源分割技术，如NVIDIA的Time-sliced和MIG，允许多个虚拟机并行运行，但管理复杂度增加并涉及显存分配。NVIDIA的vGPUA、B、C和Q系列专为不同的工作负载而设计。例如，A系列针对vCSV进行了优化，但热迁移存在限制，这可能会影响服务续性。

我们以NVIDIA的A40为例。它提供多种vGPU解决方案来适应不同用户的需求，包括虚拟桌面、AI训练、虚拟桌面和虚拟应用程序。使用vGPU需要NVIDIAGRID软件许可证，硬件要求包括IOMMU兼容处理器（例如AMD、Intel或海光/鲲鹏SMMU）和可能的SR-IOV功能。选择正确的vGPU系列（例如A系列与vCS、C系列与vPC）至关重要，但必须谨慎管理实时迁移的限制。

许可证和系列匹配：
A系列：vCS
C系列：vPC
B系列：vWS
Q系列、C系列、B系列：vWS
硬件要求：
支持IOMMU的CPU
可能需要启用SR-IOV
限制：
实时迁移限制
直接迁移GPU和vGPU虚拟机可能会中断服务

SMTXOS5.1更新引入了对GPU直通和vGPU的支持，特别适合实时渲染和AI训练。用户可以通过CloudTower轻松配置它。目前支持的NVIDIA显卡包括T4、V100和A30，vGPU分割模式根据具体GPU型号特性而有所不同。要了解有关NVIDIA显卡的vGPU支持的更多信息，请参阅官方文档。

深入探讨CPU与GPU之战，以及如何在虚拟化环境中明智地选择和管理GPU资源，将为您的企业带来前所未有的计算性能。更多信息请参阅Intel的比较，以及详细的NVIDIATeslaV100应用性能指南和vGPU用户手册虚拟GPU类型参考。