Supermicro

经过验证的 AMD GPU 系统

机架级集成、测试和发货前验证

集群规模部署、服务和支持

存储与网络集成
AMD

AMD EPYC™ 处理器

AMD Instinct™ GPU

AMD Pensando™ 网络技术

AMD 企业软件
Supermicro机架级集成方案与AMD数据中心产品相结合,可提供一套专为满足现代AI工厂严苛需求而设计的交钥匙基础设施。通过利用Supermicro在液冷技术方面的专业知识以及经过预验证的L11机架解决方案,企业能够以最佳的热效率和最少的现场配置,部署不同规模的MI350系列加速器集群。 这一协作生态系统显著缩短了产品上市时间,Supermicro 交付前对整个技术栈Supermicro 预验证和认证。最终,此次合作降低了生成式AI工作负载扩展的复杂性,使企业能够以创纪录的速度从模型交付过渡到全面模型训练。

AMD Instinct
GPU 凭借业界领先的内存容量和带宽——其中 MI355X 搭载的 288GB HBM3E 内存和 8TB/s 吞吐量尤为突出——树立了生成式人工智能和高性能计算的新标杆,使全球最大的语言模型能够在更少的节点上无缝运行。
AMD 开放软件堆栈
ROCm 软件栈为客户提供了一个开放的端到端生态系统,涵盖领先的框架和库;配合企业套件,通过优化的微服务和解决方案蓝图,简化人工智能生命周期。
AMD EPYC
这些处理器通过将业界领先的最高达 192 个“Zen 5”核心与卓越的内存带宽相结合,实现了业界领先的性能,为端到端的 AI 工作负载提供了高效的基础。
AMD Pensando
AI NIC 通过采用完全可编程的 P4 流水线以及支持Ultra Consortium (UEC) 的功能(如智能数据包分发和路径感知型拥塞控制),最大限度地提高了 AI 集群的效率,与传统的 RoCEv2 解决方案相比,可将任务完成时间缩短多达 20%。
存储
Supermicro AMD 携手领先的存储供应商,共同打造了一套全栈解决方案,可与经过验证的 AI 平台解决方案无缝集成。
| Supermicro 物料清单 SKU 号 | SRS-48UAC-MI350-8U4N-R0 | SRS-48UAC-MI355-10U4N-R0 | SRS-48ULC-MI355-4U8N-R0 | SRS-52ULC-MI355-4U12N-R0 |
|---|---|---|---|---|
| Supermicro 服务器 | AS -8126GS-TNMR | AS -A126GS-TNMR | AS -4126GS-NMR-LCC | AS -4126GS-NMR-LCC |
| 服务器散热 | 空气 | 空气 | 液体 | 液体 |
| GPU 系列 | MI350X | MI355X | MI355X | MI355X |
| 服务器集群规模(S、M、L) | 4, 16, 64 | 4, 16, 64 | 4, 32, 64 | 8, 48, 128 |
| Instinct GPU 数量 | 32, 128, 512 | 32, 128, 512 | 32, 256, 512 | 64, 384, 1024 |
| Instinct GPU 型号 | MI350X 交流 | MI355X AC | MI355X DLC | MI355X DLC |
| Pensando AI 网络接口卡的数量 | 40、160、640 | 40、160、640 | 40、320、640 | 80, 480, 1280 |
| 机架功耗(适用于中等规模集群) | 48.47 千瓦 | 63.61 千瓦 | 120.36 千瓦 | 178.71 千瓦 |

