Solutions de serveurs d'infrastructure IA pour entreprises

Accélérer chaque charge de travail

Libérez tout le potentiel de l'IA grâce aux solutions d'infrastructure de pointe de Supermicro, prêtes pour l'IA. De l'entrainement à grande échelle à l'inférence intelligente en edge, nos designs de référence clés en main rationalisent et accélèrent le déploiement de l'IA. Optimisez vos charges de travail grâce à des performances et une évolutivité optimales, tout en réduisant les coûts et l’impact environnemental. Découvrez un monde de possibilités avec la sélection variée de solutions Supermicro optimisées pour les charges de travail d'IA et accélérez tous les aspects de votre activité.

Apprentissage IA à grande échelle

HPC/AI

Inférence et entraînement en IA d'entreprises

Visualisation et conception

Diffusion de contenu et virtualisation

l'IA pour le Edge

Apprentissage et inférence d'IA à grande échelle

Grands modèles de langage, entrainement à l'IA générative, conduite autonome, robotique

L'entraînement à grande échelle de l'IA exige des technologies de pointe pour maximiser la puissance de calcul parallèle des GPU afin de gérer des milliards, voire des billions, de paramètres de modèles d'IA à entraîner avec des ensembles de données massifs. S'appuyant sur NVIDIA, HGX™ Les interfaces B300/B200, GB300/GB200 NVL72 et les interconnexions GPU-GPU NVLink® et NVSwitch® les plus rapides, offrant une bande passante jusqu'à 1,8 To/s, ainsi qu'une connectivité réseau 1:1 ultra-rapide avec chaque GPU pour le clustering de nœuds, permettent à ces systèmes d'être optimisés pour l'entraînement de grands modèles de langage à partir de zéro et leur mise à disposition pour des millions d'utilisateurs simultanés. L'ensemble de la pile est complété par… flash NVMe pour un pipeline de données IA rapide, Supermicro propose des racks entièrement intégrés avec des options de refroidissement liquide pour garantir un déploiement rapide et une expérience d'entraînement à l'IA sans encombre.

NVIDIA® HGX™ Carte mère B300 à 8 GPU — Carte graphique NVIDIA HGX B300 à 8 GPU

NVIDIA® HGX™ B200 8 GPU — HGX B200 8 GPU

NVIDIA® GB300 Grace™ Blackwell Superpuce — GB300 Grace™ Blackwell Superpuce

NVIDIA® GB200 Grace™ Blackwell Superpuce — GB200 Grâce Blackwell Superpuce

NVIDIA® HGX™ H200 8 GPU — HGX H200 8 GPU

Taille de la charge de travail

Extra Large
Large
Moyen
Stockage

Capacité de charge de travail très importante : Systèmes et racks NVIDIA HGX B300/B200 à refroidissement liquide — Systèmes et racks NVIDIA HGX B300/B200 à refroidissement liquide
En savoir plus

Taille de charge de travail très importante : NVIDIA GB300 NVL72 avec Supermicro Refroidissement liquide — NVIDIA GB300 NVL72 avec Supermicro Refroidissement liquide
En savoir plus

Taille de charge de travail très importante : NVIDIA GB200 NVL72 avec Supermicro Refroidissement liquide — NVIDIA GB200 NVL72 avec refroidissement liquide Supermicro
En savoir plus

Charge de travail importante : Systèmes et racks NVIDIA HGX B300/B200 refroidis par air — Systèmes et racks NVIDIA HGX B300/B200 refroidis par air
En savoir plus

Taille de charge de travail moyenne : Système 8U avec NVIDIA® HGX™ H200 8 GPU — Système 8U avec carte graphique NVIDIA HGX H200 à 8 GPU
En savoir plus

Stockage Flash NVMe à l'échelle du pétaoctet
En savoir plus

Échelle pétaoctet HDD — Stockage sur disque dur à l'échelle du pétaoctet
En savoir plus

Ressources

Configuration de baies de serveurs pour l'entraînement à grande échelle de l'IA

HPC/AI

Simulation d'ingénierie, recherche scientifique, séquençage génomique, découverte de médicaments

Pour accélérer le temps de découverte pour les scientifiques, les chercheurs et les ingénieurs, de plus en plus de charges de travail HPC renforcent les algorithmes d'apprentissage automatique et le calcul parallèle accéléré par le GPU pour obtenir des résultats plus rapides. De nombreux clusters de supercalculateurs parmi les plus rapides au monde tirent désormais parti des GPU et de la puissance de l'IA.

Les charges de travail HPC nécessitent généralement des simulations et des analyses intensives de données avec des ensembles de données massifs et des exigences de précision. Les GPU tels que les H100/H200 de NVIDIA offrent des performances en double précision sans précédent, atteignant 60 téraflops par GPU, et les plates-formes HPC hautement flexibles de Supermicro permettent une densité élevés de GPU et de CPU dans divers formats compacts avec une intégration à l'échelle du rack et en refroidissement liquide.

Superpuce NVIDIA® GH200 Grace Hopper™ — Superchip GH200 Grace Hopper™

NVIDIA® RTX PRO™ 6000 Blackwell GPU Server Edition — RTX PRO™ 6000 Blackwell SE

Taille de la charge de travail

Large
Moyen

Charge de travail importante : système 8U/10 avec carte graphique NVIDIA HGX B200 à 8 GPU — Système 8U/10 avec carte graphique NVIDIA HGX B200 à 8 GPU
En savoir plus

Charge de travail importante : NVIDIA GB200 NVL4 — NVIDIA GB200 NVL4
En savoir plus

Capacité de charge de travail importante : SuperBlade® 6U/8U — 6U/8U SuperBlade ®
En savoir plus

Charge de travail moyenne : 4U/5U, 8 à 10 GPU PCIe — 3U/4U/5U 8-10 GPU PCIe
En savoir plus

Taille de charge de travail moyenne : Système de trémie Grace 1U — Système 1U Grace Hopper
En savoir plus

Ressources

Configuration de baies de serveurs pour IA/HPC

Inférence et entraînement en IA d'entreprises

Inférence d'IA générative, services/applications basés sur l'IA, Chatbots, système de recommandation, automatisation des affaires

L'essor de l'IA générative est reconnu comme la prochaine frontière pour diverses industries, de la technologie à la banque et aux médias. La course à l'adoption de l'IA a commencé en tant que source d'innovation, d'augmentation significative de la productivité, de rationalisation des opérations, de prise de décisions fondées sur des données et d'amélioration de l'expérience client.

Qu'il s'agisse d'applications et de modèles commerciaux assistés par l'IA, de chatbots intelligents semblables à des humains pour le service client, ou d'IA pour copiloter la génération de code et la création de contenu, les entreprises peuvent exploiter des frameworks ouverts, des bibliothèques, des modèles d'IA pré-entraînés, et les affiner pour des cas d'utilisation uniques avec leur propre ensemble de données. Alors que l'entreprise adopte des infrastructures d'IA, la gamme de systèmes optimisés pour le GPU de Supermicro offre une architecture modulaire ouverte, une flexibilité vis à vis des fournisseurs, des options de déploiement et de mise à niveau faciles pour des technologies qui évoluent rapidement.

NVIDIA® RTX PRO™ 4500 Blackwell GPU Server Edition — RTX PRO 4500 Blackwell SE

Taille de la charge de travail

Extra Large
Large
Moyen

Charge de travail très importante : 4U/5U, 8 à 10 GPU PCIe — 3U/4U/5U 8-10 GPU PCIe
En savoir plus

Taille de charge de travail moyenne : SuperBlade® 6U — 6U SuperBlade®
En savoir plus

Taille de charge de travail moyenne : système MGX 2U — Système MGX 2U
En savoir plus

Taille de charge de travail moyenne : système Grace MGX 2U — Système Grace MGX 2U
En savoir plus

Ressources

Configuration de baies de serveurs pour l'inférence et l'entraînement de l'IA en entreprise

Visualisation et conception

Collaboration en temps réel, conception 3D, développement de jeux

La fidélité accrue des graphiques 3D et des applications basées sur l'IA grâce aux GPU modernes accélère la numérisation industrielle, transformant les processus de développement et de conception de produits, la fabrication et la création de contenu grâce à des simulations 3D réalistes permettant d'atteindre de nouveaux sommets en termes de qualité, d'itérations infinies sans coûts d'opportunité et de délais de mise sur le marché plus courts.

Construisez une infrastructure de production virtuelle à grande échelle pour accélérer la numérisation industrielle grâce aux solutions entièrement intégrées de Supermicro, notamment les systèmes 4U/5U 8-10 GPU, une architecture de référence NVIDIA OVX ™, optimisée pour NVIDIA Omniverse Enterprise avec des connecteurs Universal Scene Description (USD), ainsi que des serveurs rackables et des stations de travail multi-GPU certifiés par NVIDIA.

Taille de la charge de travail

Large
Moyen

Charge de travail importante : 4U/5U 8 GPU — 4U/5U 8 GPU
En savoir plus

Taille de charge de travail moyenne : 2U Hyper — 2U Hyper
En savoir plus

Charge de travail moyenne : station de travail IA — Stations de travail IA
En savoir plus

Charge de travail moyenne : Station de travail graphique — Station de travail graphiques
En savoir plus

Ressources

Configuration des baies de serveurs pour la visualisation et Omniverse

Diffusion de contenu et virtualisation

Réseaux de diffusion de contenu (CDN), transcodage, compression, jeux dans le cloud/streaming

Les charges de travail liées à la diffusion de vidéos continuent de représenter une part importante du trafic Internet actuel. Alors que les fournisseurs de services de streaming proposent de plus en plus de contenu en 4K, voire 8K, ou des jeux dans le cloud avec un taux de rafraîchissement plus élevé, l'accélération GPU avec les moteurs de rendu est indispensable pour multiplier les performances de débit en streaming tout en réduisant la quantité de données nécessaires avec une meilleure fidélité visuelle, grâce aux dernières technologies telles que l'encodage et le décodage AV1.

Les systèmes multi-nœuds et multi-GPU de Supermicro, tels que le système BigTwin® 2U à 4 nœuds, répondent aux fortes exigences de la diffusion vidéo moderne, chaque nœud prenant en charge le GPU NVIDIA L4 avec la possibilité de disposer de beaucoup de stockage PCIe Gen5 et de performance réseau pour alimenter le flux de données exigeant des réseaux de diffusion de contenu.

Taille de la charge de travail

Large
Moyen
Petit

Charge de travail importante : BigTwin® 2U 4 nœuds — 2U 4-Node BigTwin®
En savoir plus

Taille de charge de travail moyenne : CloudDC 2U UP — 2U UP CloudDC
En savoir plus

Charge de travail de faible envergure : Hyper-E 2U DP — 2U DP Hyper
En savoir plus

Ressources

Configuration de baies de serveurs pour la diffusion de contenu et la virtualisation

IA de périphérie

Transcodage vidéo en périphérie, inférence en périphérie, entrainement en périphérie

Dans tous les secteurs d'activité, les entreprises dont les employés et les clients se trouvent en périphérie - dans les villes, les usines, les magasins de détail, les hôpitaux et bien d'autres - investissent de plus en plus dans le déploiement de l'IA en périphérie. En traitant les données et en utilisant des algorithmes d'IA et de ML à la périphérie, les entreprises surmontent les limitations de bande passante et de latence, permettant des analyses en temps réel pour une prise de décision opportune, des soins prédictifs et des services personnalisés, ainsi que des opérations commerciales rationalisées.

Les serveurs Supermicro Edge IA spécialement conçus et optimisés pour environnement spécifique, avec différents formats compacts, offrent les performances nécessaires pour des faibles latences, une architecture ouverte avec des composants pré-intégrés, une compatibilité avec différentes piles matérielles et logicielles, ainsi que les fonctionnalités de confidentialité et de sécurité requises pour les déploiements complexes en périphérie, dès leur sortie de l'emballage.

Taille de la charge de travail

Extra Large
Large
Moyen
Petit

Taille de charge de travail très importante : Hyper -E — Hyper -E
En savoir plus

Charge de travail importante : Système compact pour bordures de boîte — Compact
En savoir plus

Taille de charge de travail moyenne : Serveur Edge multi-GPU à faible profondeur — Serveur Edge multi-GPU à faible profondeur
En savoir plus

Charge de travail réduite : Intégré — Sans ventilateur
En savoir plus

Ressources

Configuration de baies de serveurs pour l'IA en périphérie

Solutions présentées

Discours d'ouverture du PDG de COMPUTEX 2024

Infrastructure d'IA

Data Center Building Block Solutions® (DCBBS)

Fabrique d'IA

IA de périphérie

Stockage IA

Solutions d'IA pour l'industrie

Solutions NVIDIA

AMD Solutions

Solutions Intel

Solutions Arm AGI

Serveurs rackables

Processeur double

Processeur unique

Multiprocesseur

Serveurs GPU

Lignes GPU 8U/10U

Lignes de GPU 4U/5U

Lignes de GPU 2U

Lignes GPU 1U

Serveurs jumeaux

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

Serveurs lames

SuperBlade®

MicroBlade®

Microcloud

Serveurs de stockage

Tous les systèmes de stockage

Tous- Flash NVMe

Rangement à chargement par le haut

JBOF

Stockage de grâce à l'échelle pétascale

Stockage optimisé pour les entreprises

Armoires de stockage JBOD

Cartes mères

Cartes mères serveur

Tableaux de travail

Cartes embarquées / IoT

Cartes mères de bureau / de jeu

Matrice de la carte mère

Références globales

Châssis

Châssis 1U

Châssis 2U

Châssis 3U

Châssis tour 4U

Tour moyenne / mini

Châssis embarqué / IoT

Racks mobiles / Kits d'entraînement

Armoires de stockage JBOD

Références globales

SuperRack®

Service d'intégration de rack

Accessoires

Matrice de câbles

Matrice de cartes Riser

Matrice de stockage AOC

Matrice d'alimentation

Matrice de dissipateur thermique

Matrice de ventilateurs du système

Racks mobiles / Kits d'entraînement

Enjoliveurs de châssis avant

Stockage, E/S, Sécurité

Systèmes d'IA et d'IoT en périphérie

Systèmes de bord compacts

Serveurs Edge compacts

Serveurs Edge montés en rack

Composants embarqués

Cartes mères embarquées

Châssis intégré

Interrupteurs

Adaptateurs

SuperWorkstations

Plateforme de développement d'IA refroidie par liquide

Processeur unique

Processeur double

Ordinateur de bureau