Soluciones de servidores de infraestructura de IA para empresas

Acelere todas las cargas de trabajo

Desbloquea todo el potencial de la IA con Supermicro Soluciones de infraestructura de vanguardia preparadas para IA. Desde el entrenamiento a gran escala hasta la inferencia inteligente en el borde, nuestros diseños de referencia llave en mano simplifican y aceleran la implementación de la IA. Potencie sus cargas de trabajo con un rendimiento y escalabilidad óptimos, al tiempo que optimiza los costos y minimiza el impacto ambiental. Descubra un mundo de posibilidades con Supermicro La diversa selección de soluciones de IA optimizadas para cargas de trabajo acelera todos los aspectos de su negocio .

Entrenamiento de IA a gran escala

HPC/AI

Inferencia y entrenamiento de IA empresarial

Visualización y diseño

Entrega de contenido y virtualización

AI Edge

Entrenamiento e inferencia de IA a gran escala

Grandes modelos lingüísticos, entrenamiento generativo de IA, conducción autónoma, robótica

El entrenamiento de IA a gran escala exige tecnologías de vanguardia para maximizar la potencia de computación paralela de las GPU para manejar miles de millones, si no billones, de parámetros de modelos de IA que se entrenarán con conjuntos de datos masivos. Aprovechando la tecnología de NVIDIA HGX™ Los sistemas B300/B200, GB300/GB200 NVL72 y las interconexiones GPU-GPU NVLink® y NVSwitch® más rápidas, con un ancho de banda de hasta 1,8 TB/s, y la conexión en red 1:1 más rápida a cada GPU para la agrupación de nodos, están optimizados para entrenar grandes modelos de lenguaje desde cero y servirlos a millones de usuarios concurrentes. El conjunto se completa con tecnología totalmente flash. NVMe para una rápida canalización de datos de IA, Supermicro Proporciona bastidores totalmente integrados con opciones de refrigeración líquida para garantizar una implementación rápida y una experiencia de entrenamiento de IA fluida.

NVIDIA® HGX™ B300 de 8 GPU — NVIDIA HGX B300 de 8 GPU

NVIDIA® HGX™ B200 de 8 GPU — HGX B200 de 8 GPU

NVIDIA® GB300 Grace™ Blackwell Superchip — GB300 Gracia™ Blackwell Superchip

NVIDIA® GB200 Grace™ Blackwell Superchip — GB200 Gracia Blackwell Superchip

NVIDIA® HGX™ H200 8 GPU — HGX H200 de 8 GPU

Tamaños de carga de trabajo

Extra grande
Grande
Mediana
Almacenamiento

Tamaño de carga de trabajo extra grande: Sistemas y racks NVIDIA HGX B300/B200 con refrigeración líquida. — Sistemas y racks NVIDIA HGX B300/B200 con refrigeración líquida
Obtenga más información

Tamaño de carga de trabajo extra grande: NVIDIA GB300 NVL72 con Supermicro Refrigeración líquida — NVIDIA GB300 NVL72 con Supermicro Refrigeración líquida
Obtenga más información

Tamaño de carga de trabajo extra grande: NVIDIA GB200 NVL72 con Supermicro Refrigeración líquida — NVIDIA GB200 NVL72 con Supermicro Refrigeración líquida
Obtenga más información

Gran tamaño de carga de trabajo: Sistemas y racks NVIDIA HGX B300/B200 con refrigeración por aire. — Sistemas y racks NVIDIA HGX B300/B200 con refrigeración por aire
Obtenga más información

Tamaño de carga de trabajo medio: sistema 8U con NVIDIA® HGX™ H200 8 GPU — Sistema 8U con NVIDIA HGX H200 de 8 GPU
Obtenga más información

Escala de petabytes NVMe Destello
Obtenga más información

Escala de petabytes HDD Almacenamiento
Obtenga más información

Recursos

Configuración de bastidor de servidor para formación de IA a gran escala

HPC/AI

Simulación de ingeniería, investigación científica, secuenciación genómica, descubrimiento de fármacos

Cada vez son más las cargas de trabajo de HPC que aumentan los algoritmos de aprendizaje automático y la computación paralela acelerada por GPU para acelerar los descubrimientos de científicos, investigadores e ingenieros. Muchos de los clusters de supercomputación más rápidos del mundo ya aprovechan las ventajas de las GPU y el poder de la IA.

Las cargas de trabajo de HPC normalmente requieren simulaciones y análisis intensivos en datos con conjuntos de datos masivos y requisitos de precisión. Las GPU como las H100/H200 de NVIDIA proporcionan un rendimiento de doble precisión sin precedentes, ofreciendo 60 teraflops por GPU, y Supermicro Las plataformas HPC altamente flexibles de permiten un elevado número de GPU y CPU en una variedad de formatos compactos con integración a escala de rack y refrigeración líquida.

Superchip NVIDIA® GH200 Grace Hopper™ — GH200 Grace Hopper™ Superchip

NVIDIA® RTX PRO™ 6000 Blackwell GPU Server Edition — RTX PRO™ 6000 Blackwell SE

Tamaños de carga de trabajo

Grande
Mediana

Gran tamaño de carga de trabajo: sistema 8U/10 con NVIDIA HGX B200 de 8 GPU. — Sistema 8U/10 con NVIDIA HGX B200 de 8 GPU
Obtenga más información

Gran tamaño de carga de trabajo: NVIDIA GB200 NVL4 — NVIDIA GB200 NVL4
Obtenga más información

Gran capacidad de carga de trabajo: SuperBlade® 6U/8U — 6U/8U SuperBlade ®
Obtenga más información

Tamaño de carga de trabajo medio: 4U/5U, 8-10 GPU PCIe — 3U/4U/5U 8-10 GPU PCIe
Obtenga más información

Tamaño de carga de trabajo medio: sistema Grace Hopper de 1U — Sistema de tolva Grace 1U
Obtenga más información

Recursos

Configuración de racks de servidores para IA/HPC

Inferencia y entrenamiento de IA empresarial

Inferencia generativa de IA, servicios/aplicaciones basados en IA, chatbots, sistemas de recomendación, automatización empresarial

El auge de la IA generativa ha sido reconocido como la próxima frontera para diversos sectores, desde la tecnología hasta la banca y los medios de comunicación. Ha comenzado la carrera por adoptar la IA como fuente para generar innovación, impulsar significativamente la productividad, agilizar las operaciones, tomar decisiones basadas en datos y mejorar la experiencia del cliente.

Tanto si se trata de aplicaciones y modelos de negocio asistidos por IA, como de chatbots inteligentes similares a los humanos para la atención al cliente, o de IA para copilotar la generación de código y la creación de contenidos, las empresas pueden aprovechar marcos abiertos, bibliotecas, modelos de IA preentrenados y perfeccionarlos para casos de uso únicos con su propio conjunto de datos. A medida que la empresa adopta la infraestructura de IA, la variedad de sistemas optimizados para GPU de Supermicro proporciona una arquitectura modular abierta, flexibilidad de proveedor y rutas de despliegue y actualización sencillas para tecnologías en rápida evolución.

NVIDIA® RTX PRO™ 4500 Blackwell GPU Server Edition — RTX PRO 4500 Blackwell SE

Tamaños de carga de trabajo

Extra grande
Grande
Mediana

Tamaño de carga de trabajo extra grande: 4U/5U, 8-10 GPU PCIe — 3U/4U/5U 8-10 GPU PCIe
Obtenga más información

Tamaño de carga de trabajo medio: 6U SuperBlade® — 6U SuperBlade ®
Obtenga más información

Tamaño de carga de trabajo medio: Sistema MGX de 2U — Sistema MGX 2U
Obtenga más información

Tamaño de carga de trabajo medio: Sistema Grace MGX de 2U — Sistema Grace MGX 2U
Obtenga más información

Recursos

Configuración de racks de servidores para inferencia y entrenamiento de IA empresarial

Visualización y diseño

Colaboración en tiempo real, diseño 3D, desarrollo de juegos

La mayor fidelidad de los gráficos 3D y las aplicaciones habilitadas para IA por las GPU modernas está acelerando la digitalización industrial, transformando los procesos de desarrollo y diseño de productos, la fabricación y la creación de contenidos con simulaciones 3D fieles a la realidad para alcanzar nuevas cotas de calidad, iteraciones infinitas sin costes de oportunidad y plazos de comercialización más rápidos.

Construir infraestructura de producción virtual a gran escala para acelerar la digitalización industrial mediante Supermicro Las soluciones totalmente integradas de NVIDIA incluyen sistemas de 8 a 10 GPU en formatos 4U/5U, una arquitectura de referencia NVIDIA OVX ™ , optimizada para NVIDIA Omniverse Enterprise con conectores Universal Scene Description (USD), y servidores para montaje en rack y estaciones de trabajo multi-GPU con certificación NVIDIA.

Tamaños de carga de trabajo

Grande
Mediana

Gran tamaño de carga de trabajo: 4U/5U 8 GPU — 4U/5U 8 GPU
Obtenga más información

Tamaño de carga de trabajo medio: 2U Hyper — 2U Hyper
Obtenga más información

Tamaño de carga de trabajo medio: Estación de trabajo de IA — Estaciones de trabajo de IA
Obtenga más información

Tamaño de carga de trabajo medio: Estación de trabajo gráfica — Estaciones de trabajo gráficas
Obtenga más información

Recursos

Configuración de bastidores de servidores para visualización y omniverso

Entrega de contenido y virtualización

Redes de distribución de contenidos (CDN), transcodificación, compresión, juegos en la nube y streaming

Las cargas de trabajo de distribución de vídeo siguen constituyendo una parte significativa del tráfico actual de Internet. A medida que los proveedores de servicios de streaming ofrecen cada vez más contenidos en 4K e incluso 8K, o juegos en la nube con una mayor frecuencia de actualización, la aceleración de la GPU con motores multimedia es imprescindible para multiplicar el rendimiento de los canales de streaming y reducir la cantidad de datos necesarios con una mayor fidelidad visual, gracias a las últimas tecnologías como la codificación y descodificación AV1.

Supermicro Los sistemas multinodo y multi-GPU de , como el sistema 2U 4-Node BigTwin ® cumplen con los estrictos requisitos de la entrega de video moderna, cada nodo admite la GPU NVIDIA L4 con la capacidad de presentar una gran cantidad de PCIe La velocidad de almacenamiento y de red de quinta generación permite gestionar el exigente flujo de datos de las redes de distribución de contenido.

Tamaños de carga de trabajo

Grande
Mediana
Pequeño

Gran tamaño de carga de trabajo: BigTwin® 2U de 4 nodos — BigTwin® de 4 nodos y 2U
Obtenga más información

Tamaño de carga de trabajo medio: CloudDC 2U UP — 2U UP CloudDC
Obtenga más información

Tamaño de carga de trabajo pequeño: Hyper -E 2U DP — DP 2U Hyper -MI
Obtenga más información

Recursos

Configuración del bastidor del servidor para la entrega y virtualización de contenidos

Inteligencia Artificial

Transcodificación de vídeo Edge, inferencia Edge, formación Edge

En todos los sectores, las empresas cuyos empleados y clientes trabajan en ubicaciones periféricas (ciudades, fábricas, tiendas, hospitales, etc.) están invirtiendo cada vez más en la implementación de la IA en el perímetro. Al procesar los datos y utilizar algoritmos de IA y ML en el perímetro, las empresas superan las limitaciones de ancho de banda y latencia, lo que permite el análisis en tiempo real para la toma de decisiones oportuna, la atención predictiva y los servicios personalizados, así como la optimización de las operaciones empresariales.

Los servidores Supermicro Edge AI, creados específicamente y optimizados para el entorno, con varios factores de forma compactos, ofrecen el rendimiento necesario para una baja latencia, arquitectura abierta con componentes preintegrados, compatibilidad con diversas pilas de hardware y software, y conjuntos de características de privacidad y seguridad necesarios para despliegues edge complejos listos para usar.

Tamaños de carga de trabajo

Extra grande
Grande
Mediana
Pequeño

Tamaño de carga de trabajo extra grande: Hyper -MI — Hyper -MI
Obtenga más información

Gran capacidad de carga: Sistema compacto de borde de caja — Compacto
Obtenga más información

Tamaño de carga de trabajo medio: Servidor perimetral multi-GPU de poca profundidad — Servidor perimetral multi-GPU de poca profundidad
Obtenga más información

Tamaño de carga de trabajo pequeño: Integrado — Sin ventilador
Obtenga más información

Recursos

Configuración de rack de servidores para Edge AI

Soluciones destacadas

Discurso principal del CEO en COMPUTEX 2024

Infraestructura de IA

Data Center Building Block Solutions® (DCBBS)

Fábrica de IA

Inteligencia Artificial

Almacenamiento de IA

Soluciones de IA para la industria

Soluciones NVIDIA

AMD Soluciones

Soluciones Intel

Soluciones Arm AGI

Servidores Rack

Procesador dual

Procesador único

Multiprocesador

Servidores GPU

Líneas de GPU 8U/10U

Líneas de GPU 4U/5U

Líneas de GPU 2U

Líneas de GPU 1U

Servidores Twin

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

Blade

SuperBlade

MicroBlade

MicroCloud

Almacenamiento

Todos los sistemas de almacenamiento

Todo flash NVMe

Almacenamiento de carga superior

JBOF

Almacenamiento Grace a escala Petascale

Almacenamiento optimizado para empresas

Cajas de almacenamiento JBOD

Placas base

Servidores

Mesas de trabajo

Placas integradas / IoT

Sobremesa / Placas de juego

Matriz de la placa base

SKU globales

Chasis

Chasis 1U

Chasis 2U

Chasis 3U

Chasis de torre 4U

Torre mediana/minitorre

Chasis integrado/IoT

Soportes móviles / Kits de accionamiento

Cajas de almacenamiento JBOD

SKU globales

SuperRack®

Servicio de integración en bastidor

Accesorios

Matriz de cables

Matriz de tarjetas elevadoras

Matriz AOC de almacenamiento

Matriz de suministro de energía

Matriz de disipación de calor

Matriz de ventiladores del sistema

Soportes móviles / Kits de accionamiento

Embellecedores del chasis delantero

Almacenamiento, E/S, Seguridad

Sistemas de IA e IoT de borde

Sistemas de bordes compactos

Servidores Edge compactos

Servidores perimetrales para montaje en rack

Componentes integrados

Placas base integradas

Chasis integrado

Interruptores

Adaptadores

SuperWorkstations

Plataforma de desarrollo de IA con refrigeración líquida

Procesador único

Procesador dual

De oficina