NVIDIA Blackwell Ultra Sistemas, ¡ya disponibles!
Supercluster NVIDIA GB300 NVL72
Coloso xAI
SuperClúster de IA Generativa
Desbloquea todo el potencial de la IA con Supermicro Soluciones de infraestructura de vanguardia preparadas para IA. Desde el entrenamiento a gran escala hasta la inferencia inteligente en el borde, nuestros diseños de referencia llave en mano simplifican y aceleran la implementación de la IA. Potencie sus cargas de trabajo con un rendimiento y escalabilidad óptimos, al tiempo que optimiza los costos y minimiza el impacto ambiental. Descubra un mundo de posibilidades con Supermicro La diversa selección de soluciones de IA optimizadas para cargas de trabajo acelera todos los aspectos de su negocio .
Entrenamiento e inferencia de IA a gran escala
Grandes modelos lingüísticos, entrenamiento generativo de IA, conducción autónoma, robótica
El entrenamiento de IA a gran escala exige tecnologías de vanguardia para maximizar la potencia de computación paralela de las GPU para manejar miles de millones, si no billones, de parámetros de modelos de IA que se entrenarán con conjuntos de datos masivos. Aprovechando la tecnología de NVIDIA HGX™ Los sistemas B300/B200, GB300/GB200 NVL72 y las interconexiones GPU-GPU NVLink® y NVSwitch® más rápidas, con un ancho de banda de hasta 1,8 TB/s, y la conexión en red 1:1 más rápida a cada GPU para la agrupación de nodos, están optimizados para entrenar grandes modelos de lenguaje desde cero y servirlos a millones de usuarios concurrentes. El conjunto se completa con tecnología totalmente flash. NVMe para una rápida canalización de datos de IA, Supermicro Proporciona bastidores totalmente integrados con opciones de refrigeración líquida para garantizar una implementación rápida y una experiencia de entrenamiento de IA fluida.





Tamaños de carga de trabajo
- Extra grande
- Grande
- Mediana
- Almacenamiento

Sistemas y racks NVIDIA HGX B300/B200 con refrigeración líquida

NVIDIA GB300 NVL72 con Supermicro Refrigeración líquida

NVIDIA GB200 NVL72 con Supermicro Refrigeración líquida

Sistemas y racks NVIDIA HGX B300/B200 con refrigeración por aire

Sistema 8U con NVIDIA HGX H200 de 8 GPU

Escala de petabytes NVMe Destello

Escala de petabytes HDD Almacenamiento
Recursos

HPC/AI
Simulación de ingeniería, investigación científica, secuenciación genómica, descubrimiento de fármacos
Cada vez son más las cargas de trabajo de HPC que aumentan los algoritmos de aprendizaje automático y la computación paralela acelerada por GPU para acelerar los descubrimientos de científicos, investigadores e ingenieros. Muchos de los clusters de supercomputación más rápidos del mundo ya aprovechan las ventajas de las GPU y el poder de la IA.
Las cargas de trabajo de HPC normalmente requieren simulaciones y análisis intensivos en datos con conjuntos de datos masivos y requisitos de precisión. Las GPU como las H100/H200 de NVIDIA proporcionan un rendimiento de doble precisión sin precedentes, ofreciendo 60 teraflops por GPU, y Supermicro Las plataformas HPC altamente flexibles de permiten un elevado número de GPU y CPU en una variedad de formatos compactos con integración a escala de rack y refrigeración líquida.






Tamaños de carga de trabajo
- Grande
- Mediana

Sistema 8U/10 con NVIDIA HGX B200 de 8 GPU

NVIDIA GB200 NVL4

6U/8U SuperBlade ®

3U/4U/5U 8-10 GPU PCIe

Sistema de tolva Grace 1U
Recursos

Inferencia y entrenamiento de IA empresarial
Inferencia generativa de IA, servicios/aplicaciones basados en IA, chatbots, sistemas de recomendación, automatización empresarial
El auge de la IA generativa ha sido reconocido como la próxima frontera para diversos sectores, desde la tecnología hasta la banca y los medios de comunicación. Ha comenzado la carrera por adoptar la IA como fuente para generar innovación, impulsar significativamente la productividad, agilizar las operaciones, tomar decisiones basadas en datos y mejorar la experiencia del cliente.
Tanto si se trata de aplicaciones y modelos de negocio asistidos por IA, como de chatbots inteligentes similares a los humanos para la atención al cliente, o de IA para copilotar la generación de código y la creación de contenidos, las empresas pueden aprovechar marcos abiertos, bibliotecas, modelos de IA preentrenados y perfeccionarlos para casos de uso únicos con su propio conjunto de datos. A medida que la empresa adopta la infraestructura de IA, la variedad de sistemas optimizados para GPU de Supermicro proporciona una arquitectura modular abierta, flexibilidad de proveedor y rutas de despliegue y actualización sencillas para tecnologías en rápida evolución.




Tamaños de carga de trabajo
- Extra grande
- Grande
- Mediana

3U/4U/5U 8-10 GPU PCIe

6U SuperBlade ®

Sistema MGX 2U

Sistema Grace MGX 2U
Recursos
- Hoja de datos : Soluciones empresariales con NVIDIA RTX PRO™ Blackwell GPU de edición para servidores
- Libro Blanco : Acelerar la IA empresarial
- Información del producto : Explicación del funcionamiento interno de los servidores GPU
- Acelera todas las cargas de trabajo empresariales, en cualquier lugar, con NVIDIA RTX PRO.

Visualización y diseño
Colaboración en tiempo real, diseño 3D, desarrollo de juegos
La mayor fidelidad de los gráficos 3D y las aplicaciones habilitadas para IA por las GPU modernas está acelerando la digitalización industrial, transformando los procesos de desarrollo y diseño de productos, la fabricación y la creación de contenidos con simulaciones 3D fieles a la realidad para alcanzar nuevas cotas de calidad, iteraciones infinitas sin costes de oportunidad y plazos de comercialización más rápidos.
Construir infraestructura de producción virtual a gran escala para acelerar la digitalización industrial mediante Supermicro Las soluciones totalmente integradas de NVIDIA incluyen sistemas de 8 a 10 GPU en formatos 4U/5U, una arquitectura de referencia NVIDIA OVX ™ , optimizada para NVIDIA Omniverse Enterprise con conectores Universal Scene Description (USD), y servidores para montaje en rack y estaciones de trabajo multi-GPU con certificación NVIDIA.


Tamaños de carga de trabajo
- Grande
- Mediana

4U/5U 8 GPU

2U Hyper

Estaciones de trabajo de IA

Estaciones de trabajo gráficas
Recursos

Entrega de contenido y virtualización
Redes de distribución de contenidos (CDN), transcodificación, compresión, juegos en la nube y streaming
Las cargas de trabajo de distribución de vídeo siguen constituyendo una parte significativa del tráfico actual de Internet. A medida que los proveedores de servicios de streaming ofrecen cada vez más contenidos en 4K e incluso 8K, o juegos en la nube con una mayor frecuencia de actualización, la aceleración de la GPU con motores multimedia es imprescindible para multiplicar el rendimiento de los canales de streaming y reducir la cantidad de datos necesarios con una mayor fidelidad visual, gracias a las últimas tecnologías como la codificación y descodificación AV1.
Supermicro Los sistemas multinodo y multi-GPU de , como el sistema 2U 4-Node BigTwin ® cumplen con los estrictos requisitos de la entrega de video moderna, cada nodo admite la GPU NVIDIA L4 con la capacidad de presentar una gran cantidad de PCIe La velocidad de almacenamiento y de red de quinta generación permite gestionar el exigente flujo de datos de las redes de distribución de contenido.


Tamaños de carga de trabajo
- Grande
- Mediana
- Pequeño

BigTwin® de 4 nodos y 2U

2U UP CloudDC

DP 2U Hyper -MI
Recursos

Inteligencia Artificial
Transcodificación de vídeo Edge, inferencia Edge, formación Edge
En todos los sectores, las empresas cuyos empleados y clientes trabajan en ubicaciones periféricas (ciudades, fábricas, tiendas, hospitales, etc.) están invirtiendo cada vez más en la implementación de la IA en el perímetro. Al procesar los datos y utilizar algoritmos de IA y ML en el perímetro, las empresas superan las limitaciones de ancho de banda y latencia, lo que permite el análisis en tiempo real para la toma de decisiones oportuna, la atención predictiva y los servicios personalizados, así como la optimización de las operaciones empresariales.
Los servidores Supermicro Edge AI, creados específicamente y optimizados para el entorno, con varios factores de forma compactos, ofrecen el rendimiento necesario para una baja latencia, arquitectura abierta con componentes preintegrados, compatibilidad con diversas pilas de hardware y software, y conjuntos de características de privacidad y seguridad necesarios para despliegues edge complejos listos para usar.



Tamaños de carga de trabajo
- Extra grande
- Grande
- Mediana
- Pequeño

Hyper -MI

Compacto

Servidor perimetral multi-GPU de poca profundidad

Sin ventilador
Recursos

SuperClúster de IA Generativa
La cartera más amplia de sistemas preparados para la IA.

Implemente NVIDIA Omniverse ™ a gran escala.
Discurso principal del CEO en COMPUTEX 2024