¿Cómo se habilita el paso de GPU?

El paso de GPU se habilita activando la compatibilidad con IOMMU (VT-d o AMD -Vi) en la BIOS o UEFI del sistema, y luego configurando tu hipervisor (como KVM o VMware ESXi) para asignar la GPU directamente a una máquina virtual. También necesitas desvincular la GPU de los controladores del host e instalar los controladores de GPU adecuados en la máquina virtual invitada.

¿Necesitas dos GPU para la función de paso de GPU?

Aunque no es estrictamente necesario, se recomienda tener dos GPU. Una debe estar dedicada al sistema anfitrión y la otra a la máquina virtual. Esto garantiza que el anfitrión pueda mantener la salida de vídeo y la estabilidad del sistema, mientras que la GPU de paso directo está completamente aislada para la máquina virtual.

¿Funciona la transferencia de GPU con contenedores?

Sí, la transferencia directa de GPU se puede usar con contenedores si se configura dentro de una máquina virtual con acceso directo a la GPU. Como alternativa, las soluciones específicas para contenedores, como NVIDIA Docker o los frameworks de operadores de GPU, ofrecen acceso a la GPU en entornos Kubernetes.

¿Qué es el paso de GPU?

Transferencia de GPU

La virtualización mediante GPU passthrough permite asignar directamente una unidad de procesamiento gráfico (GPU) física a una única máquina virtual (VM). Esto posibilita que la VM acceda a todas las capacidades de la GPU como si se ejecutara directamente sobre hardware físico. La GPU passthrough omite la capa de abstracción del hipervisor, lo que proporciona un rendimiento casi nativo para cargas de trabajo con uso intensivo de gráficos o computación.

Esta funcionalidad es fundamental en casos de uso como la infraestructura de escritorio virtual (VDI), la inteligencia artificial (IA), el aprendizaje automático (ML) y la computación de alto rendimiento (HPC), donde la aceleración por GPU es necesaria para un rendimiento óptimo. A diferencia de los recursos de GPU compartidos o emulados, la función de transferencia directa (passthrough) dedica una GPU completa a una máquina virtual, lo que ofrece el máximo rendimiento y la mínima latencia.

La transferencia de GPU se implementa comúnmente mediante plataformas de virtualización como KVM (máquina virtual basada en kernel), VMware ESXi y Citrix Hypervisor, a menudo en combinación con la tecnología IOMMU (unidad de administración de memoria de entrada/salida) disponible en las unidades centrales de procesamiento (CPU) y placas base modernas.

Cómo funciona el paso de GPU

El paso de GPU es posible gracias a una combinación de soporte de virtualización a nivel de hardware y software, específicamente PCI Express ( PCIe ) transferencia de dispositivos mediante tecnologías IOMMU. Esto permite asignar una GPU física directamente a una máquina virtual invitada, evitando el control del sistema anfitrión y brindando a la máquina virtual acceso directo y de baja latencia a la GPU.

Configuración del hardware

Para que funcione el paso de GPU, el servidor debe ser compatible con IOMMU (Unidad de administración de memoria de entrada/salida), que permite el aislamiento del dispositivo y la reasignación de direcciones de memoria para PCIe dispositivos. En las plataformas Intel, esta característica se conoce como Intel VT-d; en AMD sistemas, se llama AMD -Vi. Ambos deben ser compatibles con la CPU, el chipset de la placa base y el firmware.

Para activar IOMMU, los usuarios deben habilitarlo en la configuración del BIOS o UEFI del sistema. Esto normalmente implica habilitar las extensiones de virtualización (VT-d o AMD -Vi) y asegurando que PCIe Los Servicios de Control de Acceso (ACS) se habilitan si la plataforma los admite. Algunos sistemas también pueden requerir la desactivación de funciones como Arranque Seguro o Arranque Rápido para una funcionalidad de paso directo completa.

Instalación del controlador

Una vez asignada la GPU a una máquina virtual, el sistema operativo invitado debe instalar los controladores específicos del fabricante, como los controladores de GPU de NVIDIA , AMD o Intel . Estos controladores permiten que el sistema operativo invitado reconozca y utilice todas las capacidades de la GPU física, incluyendo la aceleración 3D, los núcleos CUDA para computación paralela y las canalizaciones de renderizado aceleradas por hardware.

En algunos casos, puede ser necesario deshabilitar las interfaces gráficas a nivel de hipervisor dentro del sistema invitado para evitar conflictos de controladores, lo que garantiza que solo se utilice la GPU de paso directo.

Configuración del hipervisor

Una vez que IOMMU esté activo, el siguiente paso es configurar un hipervisor que admita PCIe Passthrough. Entre las opciones más populares se encuentran KVM/QEMU, VMware ESXi y Citrix Hypervisor (anteriormente XenServer). Estas plataformas utilizan controladores y API de virtualización de bajo nivel para facilitar la virtualización directa. PCIe Asignación de dispositivos a máquinas virtuales invitadas.

Por ejemplo, en entornos KVM, el acceso directo a dispositivos se configura mediante el módulo del kernel vfio-pci, que garantiza un acceso seguro y aislado a los dispositivos. VMware ESXi utiliza DirectPath I/O para exponer la GPU directamente a la máquina virtual, lo que permite un rendimiento casi nativo con una sobrecarga de virtualización mínima.

Vinculación de dispositivos

Un paso crítico en el paso de GPU es separar la GPU del sistema anfitrión y vincularla a la máquina virtual. Esto se hace desvinculando la GPU. PCIe dirección de cualquier controlador de host predeterminado y vincularla a un controlador de paso directo como vfio-pci.

Una vez vinculada, la GPU queda completamente inaccesible para el sistema operativo anfitrión y solo puede ser utilizada por la máquina virtual asignada. Esto evita conflictos y garantiza el acceso exclusivo a la GPU, lo cual es esencial para cargas de trabajo sensibles a la latencia, como la renderización en tiempo real, la simulación o el entrenamiento de modelos de aprendizaje profundo.

Ventajas y desafíos del paso de GPU

La transferencia directa de GPU permite que las máquinas virtuales accedan directamente a las GPU físicas, ofreciendo un rendimiento casi nativo al eludir la capa de abstracción del hipervisor. Esto la hace ideal para cargas de trabajo intensivas en computación, como el entrenamiento de IA, el renderizado de diseño asistido por computadora (CAD) y las simulaciones en tiempo real. Asignar una GPU dedicada a una máquina virtual también mejora el aislamiento y la consistencia del rendimiento, lo cual es esencial en entornos de producción.

Más allá del rendimiento puro, la función de transferencia directa amplía las capacidades de virtualización al habilitar la aceleración por GPU en escritorios virtuales, estaciones de trabajo remotas y aplicaciones en contenedores . Permite a las empresas consolidar cargas de trabajo en menos servidores físicos, manteniendo un alto rendimiento por máquina virtual, lo que se traduce en una mejor utilización del hardware y una mayor eficiencia operativa.

Sin embargo, la transferencia directa de GPU presenta desafíos técnicos. Requiere compatibilidad con IOMMU a nivel de CPU y placa base, una configuración correcta de BIOS o UEFI, y GPU que permitan la transferencia directa. Muchas GPU de consumo carecen de compatibilidad total con la virtualización, lo que puede generar problemas de compatibilidad o de controladores en los sistemas operativos invitados.

La complejidad de la configuración es otro factor, que a menudo requiere modificaciones del kernel, una vinculación precisa de los dispositivos y ajustes a nivel de hipervisor. La resolución de problemas suele ser laboriosa, especialmente en servidores sin interfaz gráfica, y los cambios normalmente requieren reinicios, ya que la compatibilidad con la conexión en caliente para GPU de paso directo es limitada o inexistente.

Requisitos de hardware para la transferencia de GPU

La implementación del paso de GPU requiere hardware de servidor que admita las funciones de virtualización IOMMU, como Intel VT-d o AMD -Vi, junto con las configuraciones adecuadas de BIOS o UEFI. La CPU, el chipset de la placa base y el firmware deben ser compatibles, y la GPU debe admitir la funcionalidad de paso directo, que normalmente se encuentra en tarjetas de clase empresarial como NVIDIA A100 o AMD Serie Instinct MI.

Además, los sistemas deberían ofrecer suficiente PCIe carriles y suministro de energía para admitir GPU de tamaño completo. Plataformas de servidor optimizadas para cargas de trabajo de GPU de alta densidad, que normalmente cuentan con características avanzadas. PCIe Se necesitan una topología adecuada, una arquitectura de refrigeración robusta y compatibilidad con el paso directo a nivel de firmware para facilitar configuraciones de paso directo eficientes en entornos de centros de datos gestionados correctamente.

Preguntas frecuentes

¿Cómo se habilita el paso de GPU?
El paso de GPU se habilita activando la compatibilidad con IOMMU (VT-d o AMD -Vi) en la BIOS o UEFI del sistema, y luego configurando tu hipervisor (como KVM o VMware ESXi) para asignar la GPU directamente a una máquina virtual. También necesitas desvincular la GPU de los controladores del host e instalar los controladores de GPU adecuados en la máquina virtual invitada.
¿Necesitas dos GPU para la función de paso de GPU?
Aunque no es estrictamente necesario, se recomienda tener dos GPU. Una debe estar dedicada al sistema anfitrión y la otra a la máquina virtual. Esto garantiza que el anfitrión pueda mantener la salida de vídeo y la estabilidad del sistema, mientras que la GPU de paso directo está completamente aislada para la máquina virtual.
¿Funciona la transferencia de GPU con contenedores?
Sí, la transferencia directa de GPU se puede usar con contenedores si se configura dentro de una máquina virtual con acceso directo a la GPU. Como alternativa, las soluciones específicas para contenedores, como NVIDIA Docker o los frameworks de operadores de GPU, ofrecen acceso a la GPU en entornos Kubernetes.

Infraestructura de IA

Data Center Building Block Solutions® (DCBBS)

Fábrica de IA

Inteligencia Artificial

Almacenamiento de IA

Soluciones de IA para la industria

Soluciones NVIDIA

AMD Soluciones

Soluciones Intel

Soluciones Arm AGI

Servidores Rack

Procesador dual

Procesador único

Multiprocesador

Servidores GPU

Líneas de GPU 8U/10U

Líneas de GPU 4U/5U

Líneas de GPU 2U

Líneas de GPU 1U

Servidores Twin

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

Blade

SuperBlade

MicroBlade

MicroCloud

Almacenamiento

Todos los sistemas de almacenamiento

Todo flash NVMe

Almacenamiento de carga superior

JBOF

Almacenamiento Grace a escala Petascale

Almacenamiento optimizado para empresas

Cajas de almacenamiento JBOD

Placas base

Servidores

Mesas de trabajo

Placas integradas / IoT

Sobremesa / Placas de juego

Matriz de la placa base

SKU globales

Chasis

Chasis 1U

Chasis 2U

Chasis 3U

Chasis de torre 4U

Torre mediana/minitorre

Chasis integrado/IoT

Soportes móviles / Kits de accionamiento

Cajas de almacenamiento JBOD

SKU globales

SuperRack®

Servicio de integración en bastidor

Accesorios

Matriz de cables

Matriz de tarjetas elevadoras

Matriz AOC de almacenamiento

Matriz de suministro de energía

Matriz de disipación de calor

Matriz de ventiladores del sistema

Soportes móviles / Kits de accionamiento

Embellecedores del chasis delantero

Almacenamiento, E/S, Seguridad

Sistemas de IA e IoT de borde

Sistemas de bordes compactos

Servidores Edge compactos

Servidores perimetrales para montaje en rack

Componentes integrados

Placas base integradas

Chasis integrado

Interruptores

Adaptadores

SuperWorkstations

Plataforma de desarrollo de IA con refrigeración líquida

Procesador único

Procesador dual

De oficina