Les systèmes NVIDIA Blackwell Ultra sont désormais expédiés
NVIDIA GB300 NVL72 SuperCluster
xAI Colossus
SuperCluster d'IA générative
Libérez tout le potentiel de l'IA grâce aux solutions d'infrastructure de pointe de Supermicro, prêtes pour l'IA. De l'entrainement à grande échelle à l'inférence intelligente en edge, nos designs de référence clés en main rationalisent et accélèrent le déploiement de l'IA. Optimisez vos charges de travail grâce à des performances et une évolutivité optimales, tout en réduisant les coûts et l’impact environnemental. Découvrez un monde de possibilités avec la sélection variée de solutions Supermicro optimisées pour les charges de travail d'IA et accélérez tous les aspects de votre activité.
Apprentissage et inférence d'IA à grande échelle
Grands modèles de langage, entrainement à l'IA générative, conduite autonome, robotique
L'entraînement de l'IA à grande échelle exige des technologies de pointe pour maximiser la puissance de calcul parallèle des GPU afin de gérer des milliards, voire des trillions, de paramètres de modèles d'IA à entraîner avec des ensembles de données massifs. S'appuyant sur les NVL72 HGX™ B200 et GB200 de NVIDIA et sur les interconnexions GPU-GPU NVLink® & NVSwitch® les plus rapides avec jusqu'à 1,8 To/s de bande passante, ainsi que sur la mise en réseau 1:1 la plus rapide vers chaque GPU pour le clustering de nœuds, ces systèmes sont optimisés pour entraîner de grands modèles de langage à partir de zéro et les mettre à disposition à des millions d'utilisateurs simultanés. En complétant l'infrastructure avec du stockage NVMe flash pour un pipeline de données d'IA rapide, nous proposons des racks entièrement intégrés avec des options de refroidissement liquide pour assurer un déploiement rapide et une expérience d'entraînement à l'IA sans heurts.



Taille de la charge de travail
- Extra Large
- Large
- Moyen
- Stockage

Systèmes rack NVIDIA HGX B200 refroidis par liquide

NVIDIA GB200 NVL72 avec refroidissement liquide Supermicro

Système 10U avec NVIDIA HGX B200 8-GPU et système 8U avec HGX H200 8-GPU

Système 4U 4-GPU

Stockage Flash NVMe à l'échelle du pétaoctet

Stockage sur disque dur à l'échelle du pétaoctet
Ressources

HPC/AI
Simulation d'ingénierie, recherche scientifique, séquençage génomique, découverte de médicaments
Pour accélérer le temps de découverte pour les scientifiques, les chercheurs et les ingénieurs, de plus en plus de charges de travail HPC renforcent les algorithmes d'apprentissage automatique et le calcul parallèle accéléré par le GPU pour obtenir des résultats plus rapides. De nombreux clusters de supercalculateurs parmi les plus rapides au monde tirent désormais parti des GPU et de la puissance de l'IA.
Les charges de travail HPC nécessitent généralement des simulations et des analyses intensives de données avec des ensembles de données massifs et des exigences de précision. Les GPU tels que les H100/H200 de NVIDIA offrent des performances en double précision sans précédent, atteignant 60 téraflops par GPU, et les plates-formes HPC hautement flexibles de Supermicro permettent une densité élevés de GPU et de CPU dans divers formats compacts avec une intégration à l'échelle du rack et en refroidissement liquide.




Taille de la charge de travail
- Large
- Moyen

Système 4U 4-GPU ou Système 8U 8-GPU

8U SuperBlade®

4U/5U 8-10 GPU PCIe

Système 1U Grace Hopper
Ressources

Inférence et entraînement en IA d'entreprises
Inférence d'IA générative, services/applications basés sur l'IA, Chatbots, système de recommandation, automatisation des affaires
L'essor de l'IA générative est reconnu comme la prochaine frontière pour diverses industries, de la technologie à la banque et aux médias. La course à l'adoption de l'IA a commencé en tant que source d'innovation, d'augmentation significative de la productivité, de rationalisation des opérations, de prise de décisions fondées sur des données et d'amélioration de l'expérience client.
Qu'il s'agisse d'applications et de modèles commerciaux assistés par l'IA, de chatbots intelligents semblables à des humains pour le service client, ou d'IA pour copiloter la génération de code et la création de contenu, les entreprises peuvent exploiter des frameworks ouverts, des bibliothèques, des modèles d'IA pré-entraînés, et les affiner pour des cas d'utilisation uniques avec leur propre ensemble de données. Alors que l'entreprise adopte des infrastructures d'IA, la gamme de systèmes optimisés pour le GPU de Supermicro offre une architecture modulaire ouverte, une flexibilité vis à vis des fournisseurs, des options de déploiement et de mise à niveau faciles pour des technologies qui évoluent rapidement.



Taille de la charge de travail
- Extra Large
- Large
- Moyen

4U/5U 8-10 GPU PCIe

6U SuperBlade®

Système MGX 2U

Système Grace MGX 2U
Ressources

Visualisation et conception
Collaboration en temps réel, conception 3D, développement de jeux
La fidélité accrue des graphiques 3D et des applications basées sur l'IA grâce aux GPU modernes accélère la numérisation industrielle, transformant les processus de développement et de conception de produits, la fabrication et la création de contenu grâce à des simulations 3D réalistes permettant d'atteindre de nouveaux sommets en termes de qualité, d'itérations infinies sans coûts d'opportunité et de délais de mise sur le marché plus courts.
Construisez une infrastructure de production virtuelle à grande échelle pour accélérer la numérisation industrielle grâce aux solutions entièrement intégrées de Supermicro, notamment les systèmes 4U/5U 8-10 GPU, une architecture de référence NVIDIA OVX ™, optimisée pour NVIDIA Omniverse Enterprise avec des connecteurs Universal Scene Description (USD), ainsi que des serveurs rackables et des stations de travail multi-GPU certifiés par NVIDIA.


Taille de la charge de travail
- Large
- Moyen

4U/5U 8 GPU

2U Hyper

Stations de travail IA

Station de travail graphiques
Ressources

Diffusion de contenu et virtualisation
Réseaux de diffusion de contenu (CDN), transcodage, compression, jeux dans le cloud/streaming
Les charges de travail liées à la diffusion de vidéos continuent de représenter une part importante du trafic Internet actuel. Alors que les fournisseurs de services de streaming proposent de plus en plus de contenu en 4K, voire 8K, ou des jeux dans le cloud avec un taux de rafraîchissement plus élevé, l'accélération GPU avec les moteurs de rendu est indispensable pour multiplier les performances de débit en streaming tout en réduisant la quantité de données nécessaires avec une meilleure fidélité visuelle, grâce aux dernières technologies telles que l'encodage et le décodage AV1.
Les systèmes multi-nœuds et multi-GPU de Supermicro, tels que le système BigTwin® 2U à 4 nœuds, répondent aux fortes exigences de la diffusion vidéo moderne, chaque nœud prenant en charge le GPU NVIDIA L4 avec la possibilité de disposer de beaucoup de stockage PCIe Gen5 et de performance réseau pour alimenter le flux de données exigeant des réseaux de diffusion de contenu.


Taille de la charge de travail
- Large
- Moyen
- Petit
Ressources

Edge IA
Transcodage vidéo en périphérie, inférence en périphérie, entrainement en périphérie
Dans tous les secteurs d'activité, les entreprises dont les employés et les clients se trouvent en périphérie - dans les villes, les usines, les magasins de détail, les hôpitaux et bien d'autres - investissent de plus en plus dans le déploiement de l'IA en périphérie. En traitant les données et en utilisant des algorithmes d'IA et de ML à la périphérie, les entreprises surmontent les limitations de bande passante et de latence, permettant des analyses en temps réel pour une prise de décision opportune, des soins prédictifs et des services personnalisés, ainsi que des opérations commerciales rationalisées.
Les serveurs Supermicro Edge IA spécialement conçus et optimisés pour environnement spécifique, avec différents formats compacts, offrent les performances nécessaires pour des faibles latences, une architecture ouverte avec des composants pré-intégrés, une compatibilité avec différentes piles matérielles et logicielles, ainsi que les fonctionnalités de confidentialité et de sécurité requises pour les déploiements complexes en périphérie, dès leur sortie de l'emballage.



Taille de la charge de travail
- Extra Large
- Large
- Moyen
- Petit

Hyper

Compact

Serveur Edge multi-GPU à faible profondeur

Sans ventilateur
Ressources

SuperCluster d'IA générative
Le plus large portefeuille de systèmes prêts pour l'IA

Déployer NVIDIA Omniverse™ à grande échelle
Discours du PDG de COMPUTEX 2024


