在人工智能时代,计算能力不再仅仅以服务器数量来衡量。如今的人工智能由机架中多个节点上互连的GPU、CPU、内存、存储等资源构成。为了确保每个数据中心环境的最佳性能和效率,基础设施需要高速、低延迟的网络架构,以及精心设计的冷却技术和供电方案。 Supermicro SuperCluster 解决方案为快速发展的生成式人工智能和大型语言模型(LLM) 提供端到端的 AI 数据中心解决方案。
大规模完全集成
设计和建造全机架和集群,全球生产能力达 5,000 机架 每月
通过现场服务进行测试、验证和部署
经过验证的 L11、L12 测试流程可在发货前彻底验证运行效果和效率
液体冷却/空气冷却
完全集成的液冷或风冷解决方案,包括 GPU 和 CPU 冷板、冷却分配器和歧管
供应和库存管理
一站式服务,快速、及时地提供完全集成的机架,缩短解决问题的时间,实现快速部署
全套交钥匙数据中心解决方案加快了关键任务企业用例的交付时间,并消除了构建大型集群的复杂性,而以前只有通过密集的设计调整和耗时的超级计算优化才能实现这一目标。
液冷式2 OU NVIDIA HGX B300 AI 集群
全集成液冷式 144 节点集群,最多可配备 1152 个NVIDIA B300 GPU
- NVIDIA HGX B300 采用紧凑型 2OU 液冷系统节点,提供无与伦比的 AI 训练性能密度
- Supermicro 采用直接液冷技术,配备 1.8MW 容量的机架式 CDU(机架内) CDU 可供选择的方案)
- 大容量 HBM3e GPU 显存(每个 GPU 配备 288GB* HBM3e 显存)和用于基础模型训练的系统内存占用
- 使用 NVIDIA Quantum-X800进行横向扩展InfiniBand 为了ultra低延迟、高带宽的人工智能架构
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- 旨在全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。
计算节点


液冷式 4U NVIDIA HGX B300 AI 集群
全集成液冷式72节点集群,最多可配备576个NVIDIA B300 GPU
- 借助针对计算密度和可维护性优化的 NVIDIA HGX B300,部署高性能 AI 训练和推理。
- Supermicro 采用直接液冷设计,可实现持续高功率运行并提高能源效率。
- 大容量 HBM3e GPU 显存(每个 GPU 配备 288GB* HBM3e 显存)和用于基础模型训练的系统内存占用
- 使用 NVIDIA Spectrum™-X以太网或 NVIDIA Quantum-X800进行横向扩展InfiniBand
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- 旨在全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。
计算节点


风冷式 8U NVIDIA HGX B300 AI 集群
全集成风冷式 32 节点集群,最多可配备 256 个 NVIDIA HGX B300 GPU 和 73.7TB 总 HBM3e 内存
- 基于参考架构的全栈解决方案,包括Supermicro 系统、NVIDIA GPU、NVIDIA 软件和 NVIDIA 网络
- 最多可配备 256 个 NVIDIA HGX B300 GPU,提供高达 73.7TB 的总 HBM3e 内存(每个 GPU 288GB HBM3e*)
- 与 NVIDIA 软件栈(NVIDIA AI Enterprise 和 NVIDIA Run:ai)的兼容性
- 即插即用解决方案,系统完全集成到机架中,并在发货和现场部署前经过测试。
- 利用 NVIDIA Spectrum-X以太网计算架构或 NVIDIA Quantum-X800 进行横向扩展InfiniBand融合网络和带外管理包括
- Supermicro AI Factory 解决方案获得 NVIDIA 认可,可用于基础设施配置、 Spectrum-X网络以及基于 NVIDIA 企业参考架构的 HGX B300 软件参考堆栈。

计算节点


水冷式英伟达 HGX B200AI 集群
在5 个机架中最多可配备 32 个英伟达 HGX B200 8GPU 4U 液冷系统(256 个 GPU
- 借助集成在单个可扩展单元(5 个机架)中的 256 个 NVIDIA B200 GPU,部署 AI 训练和推理性能的巅峰之作。
- Supermicro 采用250kW容量机架内冷却液分配单元的直接液冷( CDU )配备冗余电源和双热插拔水泵
- 一个可扩展单元中包含 45 TB HBM3e 内存
- 利用 400Gb/s NVIDIASpectrum-X以太网或 NVIDIA Quantum-2 InfiniBand 进行扩展
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- 旨在全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。

计算节点


风冷式英伟达 HGX B200 AI 集群
在9 个机架中配备 32 个 NVIDIA HGX B200 8GPU 10U 风冷系统(256 个 GPU
- 经过验证的行业领先架构,采用全新热优化风冷系统平台
- 一个可扩展单元中包含 45 TB HBM3e 内存
- 采用 400Gb/s NVIDIA Spectrum-X以太网或 NVIDIA Quantum-2进行横向扩展InfiniBand
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- NVIDIA 认证系统节点,全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。

计算节点


NVIDIA GB300 NVL72
单机架水冷式超大规模计算机
- 采用 NVIDIA GB300 Grace™ 的机架级解决方案Blackwell Superchip 每个机架提供 72 个 NVIDIA B300 GPU 和 36 个 Grace CPU
- 英伟达Blackwell Ultra 每个GPU配备288GB HBM3e显存
- 采用直接液冷技术,数据中心电力成本最多可降低 40%。
- 提供从咨询到全面部署的综合服务,包括所有必要的零部件、网络解决方案和现场安装服务。
- 采用 400Gb/s NVIDIA Spectrum-X以太网或 NVIDIA Quantum-2进行横向扩展InfiniBand
- NVIDIA Quantum-2 最高可达 800Gb/s InfiniBand 或带有集成 NVIDIA ConnectX®-8 超级网卡的Spectrum-X以太网

机架解决方案


NVIDIA GB200 NVL72
单机架水冷式超大规模计算机
- 72倍NVIDIA Blackwell B200 GPU 作为一个 GPU 运行,配备海量 HBM3e 显存(每个机架 13.5TB)
- 9 个 NVLink 交换机,每个计算托架 4 个端口,连接 72 个 GPU,提供 1.8TB/s 的 GPU 间互连速度。
- Supermicro 采用250kW容量机架内冷却液分配单元的直接液冷( CDU )配备冗余电源和双热插拔水泵
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- 采用 400Gb/s NVIDIA Spectrum-X以太网或 NVIDIA Quantum-2进行横向扩展InfiniBand
- 旨在全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。

机架解决方案


NVIDIA RTX PRO™ 超级集群
搭载 NVIDIA RTX PRO 6000 的 AI 工厂解决方案Blackwell 服务器版
- 基于参考架构的全栈解决方案,包括Supermicro 系统、NVIDIA GPU、NVIDIA 软件和 NVIDIA 网络
- 最高可达 256 倍 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 提供高达 24TB 的 GDDR7 显存
- 与 NVIDIA 软件栈(NVIDIA AI Enterprise、NVIDIA Omniverse 和 NVIDIA Run:ai)兼容
- 即插即用解决方案,系统完全集成到机架中,并在发货和现场部署前经过测试。
- NVIDIA Spectrum-X以太网计算架构、融合网络和带外管理功能
- Supermicro AI Factory 解决方案获得 NVIDIA 认可,可用于基础设施配置、 Spectrum-X网络以及基于 NVIDIA 企业参考架构的 RTX PRO 6000 软件参考堆栈。 Blackwell 服务器版

计算节点


领先的液冷人工智能集群
5 个机架,共 32 个 NVIDIA HGX H200 8-GPU、4U 液冷系统(256 个 GPU)
- 通过以下方式将计算密度提高一倍Supermicro为数据中心定制的液冷解决方案,可降低高达 40% 的电力成本
- 一个可扩展单元包含 256 个 NVIDIA H200 GPU
- 36TB HBM3e 内存,采用 H200 闪存,集成于一个可扩展单元中
- 专用存储架构选项,支持完整的 NVIDIA GPUDirect RDMA 和存储或 RoCE。
- 采用 400Gb/s NVIDIA Spectrum-X以太网或 NVIDIA Quantum-2进行横向扩展InfiniBand
- NVIDIA 认证系统节点,全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。

计算节点


成熟的设计
9 个机架,共 32 个 NVIDIA HGX H200 8-GPU、8U 风冷系统(256 个 GPU)
- 经过验证的行业领先架构,适用于大规模人工智能基础设施部署
- 一个可扩展单元包含 256 个 NVIDIA H200 GPU
- 36TB HBM3e 内存,采用 H200 闪存,集成于一个可扩展单元中
- 采用 400Gb/s NVIDIA Spectrum-X以太网或 NVIDIA Quantum-2进行横向扩展InfiniBand
- 可定制的人工智能数据管道存储结构,提供业界领先的并行文件系统选项
- NVIDIA 认证系统节点,全面支持 NVIDIA AI 软件平台,包括 NVIDIA AI Enterprise 和 NVIDIA Run:ai。

计算节点

