Arquitectura de inferencia escalable en AMD Plataformas de IA
Supermicro Soluciones aceleradas que incluyen: AMD Instinct™ Clústeres de GPU
Supermicro Soluciones aceleradas que incluyen: AMD Instinct™ Clústeres de GPU
SQL Server y virtualización en una única plataforma de alto rendimiento.
Supermicro El último modelo 5U PCIe Los servidores GPU están optimizados para ofrecer toda la potencia de AMD nuevo Instinct™ MI350P PCIe Las GPU ofrecen a las empresas una forma rápida y rentable de escalar las cargas de trabajo de IA generativa y automatizada sin necesidad de rediseñar sus centros de datos.
Computación industrial de alto rendimiento para implementaciones modernas de SCADA, MES e IIoT.
Myrtle.ai realizó recientemente pruebas de referencia de STAC-ML Markets (Inference) en una pila que consta de STAC-ML™ Pack para myrtle.ai VOLLO™ (Rev C) con Silicom Artena ( AMD FPGA VP1802) en Supermicro AS -2015CS-TNR (ID: MRTL260323).
STAC realizó recientemente una auditoría STAC-AI™ LANG6 (solo inferencia) del paquete STAC-AI para TensorRT-LLM (Rev D), que se ejecuta en un Supermicro Servidor SYS-222C-TN que aloja GPU NVIDIA RTX PRO 6000 gestionadas por Red Hat OpenShift 4.20. (ID: SMCI260303)
Supermicro El intercambiador de calor de puerta trasera (RDHx) ofrece hasta 120 kW de capacidad de refrigeración gracias a su diseño plug-and-cool, lo que facilita su implementación y proporciona una flexibilidad operativa excepcional. Compatible con la mayoría de los racks estándar, es ideal para la refrigeración de configuraciones de alta densidad de última generación y mejora significativamente el rendimiento térmico. Su capacidad de actualización instantánea y su rápida instalación minimizan el tiempo de inactividad, ofreciendo una agilidad superior para los operadores de centros de datos.
Adaptar las soluciones de almacenamiento para satisfacer las demandas de la IA.
Superar los desafíos de almacenamiento de la IA con soluciones escalables y de alto rendimiento.
Cómo el diseño del movimiento y el almacenamiento de datos se están convirtiendo en las principales limitaciones en la IA empresarial.
Aceleración de cargas de trabajo de IA con priorización inteligente de núcleos y Turbo Boosting
Óptica coempaquetada con menor potencia , menor latencia y hasta 2 km de alcance cada una .
El nuevo modo de memoria plana de Intel® simplifica la expansión de la memoria.
Mejoras significativas en la eficiencia de la virtualización con respecto a la tercera generación de Intel. Xeon Sistemas escalables basados en procesadores: 27 % menos de consumo de TDP, 33 % menos de núcleos, 50 % menos de servidores.
En este video, Supermicro Los equipos de Habilitación Tecnológica e Ingeniería de Sistemas de NVIDIA analizan dos de las plataformas de infraestructura de IA y HPC más potentes disponibles en la actualidad: los sistemas NVIDIA HGX B200 (SYS-822GS-NBRT) y B300 (SYS-822GS-NB3RT / AS-8126GS-NB3RT) de 8U.