Ein Bauplan für den weltgrößten flüssigkeitsgekühlten GPU-Cluster
Skalierung von Supermicro mit NVIDIA Spectrum™-X Ethernet

Skalierung von Supermicro mit NVIDIA Spectrum™-X Ethernet

Der SuperCluster Supermicro, beschleunigt durch die NVIDIA Blackwell-Plattform, ermöglicht die nächste Stufe der KI, die durch neue Durchbrüche definiert ist, darunter die Weiterentwicklung von Skalierungsgesetzen und der Aufstieg von Schlussfolgerungsmodellen. Diese neuen SuperCluster-Angebote mit NVIDIA Blackwell-Plattform sind in Konfigurationen mit 42U, 48U oder 52U erhältlich. Die verbesserten Kühlplatten und die 250-kW-Kühlmittelverteilungseinheit (CDU) verdoppeln die Kühlleistung der Vorgängergeneration. Dank des neuen vertikalen Kühlmittelverteilers (CDM) nehmen horizontale Verteiler keinen wertvollen Platz mehr im Rack ein. NVIDIA Quantum InfiniBand- oder NVIDIA Spectrum™-Netzwerke in einem zentralisierten Rack ermöglichen eine nicht blockierende, auf 256 GPUs skalierbare Einheit in fünf Racks oder eine erweiterte, auf 768 GPUs skalierbare Einheit in neun Racks.

Der SuperCluster Supermicro, beschleunigt durch die NVIDIA Blackwell-Plattform, ermöglicht die nächste Stufe der KI, die durch neue Durchbrüche definiert ist, darunter die Weiterentwicklung von Skalierungsgesetzen und der Aufstieg von Schlussfolgerungsmodellen. Der neue luftgekühlte SuperCluster Supermicrobesteht aus den neuen Supermicro HGX B200 8-GPU-Systemen. Mit einem neu gestalteten 10U-Gehäuse, das die Wärmeentwicklung seiner führenden KI aufnimmt, ist er für alle Arten von hohen KI ausgelegt, vom Training über die Feinabstimmung bis hin zur Inferenz. NVIDIA Quantum InfiniBand oder NVIDIA Spectrum™-Netzwerke in einem zentralisierten Rack ermöglichen eine nicht blockierende, auf 256 GPUs skalierbare Einheit in neun Racks.

Dieses Whitepaper enthüllt die Blaupausen eines Supermicro KI mit NVIDIA HGX™ H100/H200-GPUs. Es befasst sich eingehend mit dem Design der einzelnen Systemknoten von SuperCluster, der Komponentenauswahl, dem Rack-Layout, der Netzwerktopologie und den Bereitstellungsschritten.