当前位置：首页 > 虚拟化 > 正文

gpu容器虚拟化

虚拟化
2024-09-02 07:07:05
9972

一、哪些显卡支持GPU虚拟化

DualQuadro6000、5000。
1. DualQuadro6000：GPU虚拟化是将一张GPU卡的计算能力划分为多个逻辑上虚拟的GPU。 DualQuadro6000具有虚拟化技术，因此可以支持GPU虚拟化。
2。 DualQuadro5000：单个GPU卡可以分配给vGPU单元中的多个虚拟机，允许虚拟机运行3D软件、播放高清视频等，通过虚拟化技术大大提高用户体验，因此可以支持GPU模糊。

二、实现GPU虚拟化的几种方法包括

实现GPU虚拟化的方法有很多种。下面我列出几种常见的方式：

1.**GPU硬件虚拟化**：这是一种通过在GPU硬件层面实现虚拟化来提供多个虚拟GPU的方法。这种方法需要硬件支持，同时还需要操作系统和驱动程序的支持。其优点是性能损失小，但实现起来比较困难，需要硬件厂商的支持。

2. **基于GPUpassthrough**：该方式允许直接从物理GPU获取资源，并将一部分GPU资源分配给每个虚拟机。这种方法不需要额外的虚拟化软件，但需要 BIOS 级别的设置以及对底层硬件和操作系统的深入了解。

3. 使用容器技术：可以使用Docker、Kubernetes等容器技术进行GPU虚拟化。它们提供了一种隔离和分配资源的方法，以便每个容器都可以拥有自己的 GPU 资源份额。这种方法对于深度学习等需要大量GPU资源的场景非常有用。

4. 使用NVIDIA容器引擎：NVIDIA提供了一种称为NVIDIA容器引擎（NCE）的专用容器技术。它通过使用NVIDIA的软件堆栈将GPU资源与容器中运行的应用程序解耦，实现GPU资源的高效可靠分配。

5. 使用GPU加速的云服务商：很多云服务商都提供GPU加速的云服务，比如AWS的Graviton GPU云服务器、GCP的NVIDIAV100等，用户只需要购买这些服务就可以在云端享受高性能的GPU资源。

以上是GPU虚拟化的几种常见实现方式。每种方法都有其优点和缺点，您选择哪种方法取决于您的需求、预算、技术能力和其他因素。同时请注意，每种方法都需要一定的学习和实践才能掌握。建议根据具体情况选择最适合自己的方法。

三、虚拟化/超融合中的 GPU 直通与 vGPU

虚拟化与超融合中的 GPU 革命：直通与 vGPU 之战

快速发展的技术，GPU已经从图形处理的专属领域一跃成为AI、大数据、区块链计算的基础。在现代企业数据中心中，GPU的并行计算能力在图像处理、AI训练和推理，甚至高性能计算（HPC）任务中发挥着至关重要的作用。例如，NVIDIA 的 CUDA 平台提供了惊人的性能改进，包括： Xeon8180 不带 GPU。根据STAC-2Benchmark，该服务器的性能仅比配备GPU的服务器低1/8.9倍，具有低延迟和高能效，挑战传统CPU的地位。

在虚拟化/超融合领域，GPU使用策略主要可以分为两种模式：GPU直通和vGPU。

GPU直通（PCIePass-through）：该方法性能损失很小（小于5%），但不支持多个虚拟机之间共享，因此可能需要GPU 。不支持在线迁移，适合性能要求非常高的场景。
vGPU（虚拟GPU）：利用NVIDIA的Timeslice、MIG等GPU资源分割技术，允许多个虚拟机并行运行，但增加了管理复杂度，需要分配显存。 NVIDIA 的 vGPU 系列 A、B、C 和 Q 专为各种工作负载而设计。例如，A 系列针对 vCSV 进行了优化，但在实时迁移方面存在限制，可能会影响服务连续性。

例如，NVIDIA的A40提供了丰富的vGPU解决方案，可以适应各种用户需求，包括虚拟工作站、AI培训、虚拟桌面和虚拟应用程序。使用 vGPU 需要 NVIDIAGRID 软件许可证。硬件要求包括支持 IOMMU 的 CPU（例如 AMD、Intel 或海光/鲲鹏 SMMU）和可能的 SR-IOV 功能。选择正确的 vGPU 系列（A 系列与 vCS、C 系列与 vPC 等）很重要，但必须仔细解决实时迁移限制。

授权与系列匹配：
A系列：vCS
C系列：vPC
B系列：vWS
Q系列、C 系列、B 系列：vWS

硬件要求：
支持 IOMMU 的 CPU
开启 SR-IOV 可能需要

限制：
实时迁移限制
迁移直通GPU和vGPU虚拟机会导致服务中断

SMTXOS5.1更新引入了GPU直通和vGPU支持，特别适合实时渲染和AI训练，用户可以通过CloudTower轻松配置。目前支持的NVIDIA显卡包括T4、V100和A30，vGPU分割模式根据GPU型号的具体特性而有所不同。有关 NVIDIA 显卡的 vGPU 支持的更多信息，请参阅官方文档。

详细了解 CPU 和 GPU 之间的战争，以及如何在虚拟化环境中明智地选择和管理 GPU 资源，为您的企业带来前所未有的计算性能。有关更多信息，请参阅英特尔比较、NVIDIA 详细技术指南 Tesla V100 应用程序性能指南和 vGPU 用户手册虚拟 GPU 类型参考。

四、GPU虚拟化

上一篇文章讲解了数据虚拟化的CPU虚拟化和内存虚拟化。从某种程度上讲，GPU也用于计算，但相对于CPU应用一般计算来说，GPU主要用于图形图像要求较高的场景，比如高清视频编解码、3D游戏、物理模拟等本文带您了解GPU虚拟化技术。
芯片行业GPU技术的发展速度与CPU技术一样快，越来越多的用户开始部署虚拟桌面解决方案。因此，GPU技术与虚拟化技术的融合成为近年来虚拟化行业的热门技术话题。这样，将大大降低图形图像用户的成本，提高数据处理效率和数据安全性。。所谓GPU虚拟化，就是将一块GPU卡的算力划分为若干个逻辑上的虚拟GPU，即vGPU，并以vGPU为单位将算力分配给GPU。单个GPU卡可以分配给vGPU设备中的多个虚拟机，允许虚拟机运行3D软件、播放高清视频等，大大提高用户体验。
目前GPU虚拟化主要有以下技术：
DeviceSimulation
APIForwarding
GPUPass-Through

FullGPUVisualization
设备模拟将设备直接分配给指定的虚拟机。使用类似于CPU虚拟化中使用的二进制转换方法来执行模拟。与CPU相比，不同设备厂商的GPU规格差异较大。 GPU资源难以共享，仿真效率低。因此，典型的 QEMU 软件仅模拟 VGA 设备的基本功能。它通过半虚拟化图像缓冲区来加速特定的2D图像访问，这不能满足高效和共享虚拟化的要求。由于设备仿真没有一定的机制允许虚拟机访问图形硬件，因此这些虚拟显示设备相应地使用CPU和内存来处理图形数据。
API转发将OpenGL等图形指令从Guest虚拟机转发到虚拟机监视器VMM，实现虚拟化环境中的GPU共享。这种方法目前广泛应用于VMWare、VirutalBox等软件中。基于Chromium的VMGL和Oracle的VirtualBox，使用自定义的OpenGL库替换原来的OpenGL库，将虚拟机中的OpenGL指令转发到虚拟机监视器执行。对于GPU在通用计算中的使用，rCUDA、vCUDA和gVirtuS都使用转发CUDA和OpenGL指令来解决在虚拟化环境中运行通用GPU计算应用程序的问题。但是API转发受到平台的限制。例如，Windows使用的接口是DirectX，它与OpenGL或CUDA不兼容。因此，Linux主机无法执行从Windows客户端转发的DirectX命令。同时，API转发会导致大量的上下文切换，造成较大的性能损失。
显卡直通，也叫显卡直通，是指绕过虚拟机管理系统，将GPU单独分配给虚拟机。只允许虚拟机使用GPU 这种独占的设备分配方式，保留了GPU的完整性和独立性，接近非虚拟化条件下的性能，可用于通用计算。但显卡的实现需要用到显卡的一些特殊细节，兼容性较差。它只能在某些 GPU 设备上使用。同时GPU透传只能将GPU分配给一台虚拟机，不能在多台虚拟机之间共享。其他虚拟机无法使用GPU提供的计算能力。由于图形直通实际上使用来自客户操作系统的本机驱动程序和硬件，因此它缺乏必要的中间层来跟踪和维护 GPU 状态，并且不支持实时迁移等高级虚拟机功能。
显卡虚拟化就是将显卡进行裁剪，并将这些显卡槽分配给虚拟机使用的过程。由于支持显卡虚拟化的显卡一般可以根据需要划分为不同规格的时间片，从而可以分配给多个虚拟机使用。 GPU全虚拟化允许虚拟机直接访问性能敏感资源（如GPU访问显存），基本解决了透传与共享之间的矛盾。例如SR-IOV技术，与IO虚拟化类似，通过影子页表隔离各个虚拟GPU的访问空间，使得大部分命令的执行不受虚拟机监视器的干扰，从而使虚拟GPU能够实现在优化条件下接近非虚拟性能。
不同的显卡制造商以不同的方式实现全虚拟化。例如，AMD在其最新的GPU上使用SR-IOV（单根虚拟化）技术，Intel使用KVMGT技术来实现，Nvidia则使用GPUvm/GRID技术来实现。