Un plan para construir el mayor cluster de GPU del mundo refrigerado por líquido
Ampliación de Supermicro con NVIDIA Spectrum™-X Ethernet

Ampliación de Supermicro con NVIDIA Spectrum™-X Ethernet

El SuperCluster Supermicro, acelerado por la plataforma NVIDIA Blackwell, impulsa la siguiente etapa de la IA, definida por nuevos avances, como la evolución de las leyes de escalabilidad y el auge de los modelos de razonamiento. Estas nuevas ofertas de SuperCluster con tecnología de la plataforma NVIDIA Blackwell están disponibles en configuraciones de 42U, 48U o 52U. Las placas de refrigeración mejoradas y la unidad de distribución de refrigerante (CDU) de 250 kW duplican con creces la capacidad de refrigeración de la generación anterior. El nuevo colector de distribución de refrigerante vertical (CDM) significa que los colectores horizontales ya no ocupan un valioso espacio en el rack. La red NVIDIA Quantum InfiniBand o NVIDIA Spectrum™ en un rack centralizado permite una unidad escalable sin bloqueos de 256 GPU en cinco racks, o una unidad escalable ampliada de 768 GPU en nueve racks.

El SuperCluster Supermicro, acelerado por la plataforma NVIDIA Blackwell, impulsa la siguiente etapa de la IA, definida por nuevos avances, como la evolución de las leyes de escalabilidad y el auge de los modelos de razonamiento. El nuevo SuperCluster refrigerado por aire Supermicroestá compuesto por los nuevos sistemas Supermicro HGX B200 de 8 GPU. Con un chasis 10U rediseñado para adaptarse a la temperatura de su rendimiento informático de IA de vanguardia, está diseñado para hacer frente a cargas de trabajo de IA pesadas de todo tipo, desde el entrenamiento hasta el ajuste y la inferencia. La red NVIDIA Quantum InfiniBand o NVIDIA Spectrum™ en un rack centralizado permite una unidad escalable de 256 GPU sin bloqueos en nueve racks.

Este informe técnico revela los planos de un clúster de racks de IA Supermicro con GPU NVIDIA HGX™ H100/H200. Profundiza en el diseño de los nodos individuales del sistema SuperCluster, la selección de componentes, la disposición de los racks, la topología de red y los pasos de implementación.