跳至主要内容
现代人工智能数据中心的蓝图

Supermicro的数据中心构建模块解决方案 (DCBBS) 提供完整的模块化 AI 基础设施。DCBBS 由经过验证的组件和子系统构建而成,提供端到端的部署灵活性——从单个 GPU 和网络交换机到完整的机架、站点基础设施、管理软件和专业服务。

DCBBS

率先上市,快速部署

现场服务整体解决方案

根据您的工作量定制

发货前经过验证和测试

数据中心构件解决方案® (DCBBS)

人工智能与计算系统

业界最广泛的人工智能和计算系统产品组合,提供无与伦比的定制服务 - 从 GPU 系统到千万亿次存储、多节点系统和液冷系统。

机架内解决方案

机架内完全集成:冷却分配单元和集管、软管套件、网络交换机、电源架和备用电池单元,RDHx 可实现最大密度和效率。

行内解决方案

提供可扩展的液冷解决方案,涵盖从200kW液冷至风冷侧柜到1.8MW行级CDU,此外还提供预验证的SuperCluster解决方案,该方案集成了网络功能,专为交钥匙式多机架部署而设计。

场地基础设施解决方案

现场级冷却基础设施,配备可扩展的水冷却塔和干式冷却塔,用于热管理和电源管理。为高性能数据管道优化布线设计和实施。

管理软件套件

从裸机到人工智能工作负载的端到端超级云软件--提供统一的基础架构控制、部署自动化、开发人员工具和多租户 GPU 云管理。

服务与现场部署

从数据中心设计和解决方案验证到现场部署和持续支持,提供全面的专业服务,并提供 4 小时响应选项,以确保关键任务正常运行。

人工智能与计算系统

从业界最广泛的人工智能和计算系统产品组合中进行选择,这些系统均采用 NVIDIA 的最新技术。 AMD以及英特尔。 Supermicro的模块化设计方案可实现无与伦比的定制化和优化——从高GPU密度的AI系统到PB级存储系统——让您能够根据工作负载对每个组件进行微调。凭借可从关键电子元件中去除高达98%热量的液冷散热板,以及与领先的软件定义存储合作伙伴的无缝集成,每个系统从一开始就针对最高性能和效率进行了优化。

了解更多

Supermicro DCBBS 服务器组合照片

GPU 和 CPU 系统

广泛的密度、效率和可扩展性优化系统,采用英伟达™(NVIDIA®)、AMD 和英特尔™(Intel®)的最新人工智能和计算技术,具有各种外形尺寸,专为各种工作负载(从人工智能培训和推理到高性能计算)而设计。

存储系统

Petascale 和对象存储服务器与领先的软件定义存储合作伙伴无缝集成,为数据密集型人工智能工作负载以及大规模人工智能模型训练和大批量推理提供最大吞吐量和可扩展性。

系统Building Blocks、冷板

Supermicro -设计的液冷冷板可有效去除系统中关键电子元件高达 ​​98% 的热量,此外还配备了模块化构建模块组件,可根据特定工作负载要求对系统进行精确定制和优化。

4U NVIDIA HGX 8-GPU SystemPower Supplies and High-speed NICsGPU Cold PlatesNVIDIA HGX B200 8-GPUCPU, DIMM, and PCIe Switch Cold PlatesHot-swappable High-performance Drives

4U NVIDIA HGX 8 GPU 系统

图4U NVIDIA HGX 8 GPU 系统
  1. 热插拔高性能硬盘
  2. CPU、DIMM 和 PCIe 交换机冷板
  3. NVIDIA HGX B200 8 Gpu
  4. GPU 冷板
  5. 电源和高速网卡

机架内解决方案

通过专用的机架内集成,为要求最苛刻的 AI 和计算系统提供电源、散热和连接。 Supermicro 提供冷却液分配单元,支持高达 250kW 的液冷能力,以及包括 NVIDIA 在内的高性能网络交换机。 InfiniBand 以及以太网解决方案。结合 33kW 电源架和电池备用单元,可为应用检查点提供 90 秒的 48V 直流电源, Supermicro的机架内解决方案提供下一代 AI 数据中心所需的散热管理、网络架构、电源输送和弹性——所有这些都针对最大机架密度和运营效率进行了优化。

了解更多

Supermicro DCBBS机架解决方案拍摄

冷却液

Supermicro 冷却液是一种高性能的PG基合成液体冷却液,专为高密度AI和HPC数据中心的芯片直接液体冷却而设计,具有长期的热稳定性和化学稳定性,与金属、塑料和弹性体(包括EPDM和硅胶)具有广泛的兼容性,先进的多金属腐蚀保护,以及卓越的抗菌性能。

CDU 和 CDM

冷却液分配单元和歧管有多种配置可选,包括适用于更高服务器密度的垂直式冷却液分配单元。机架式冷却液分配单元可提供高达 250kW 的冷却能力,适用于温度高达 45°C 的液体,并标配冗余电源和水泵,以确保最高的可靠性。

后门热交换器

后门热交换器直接连接到服务器机架,从源头去除热量,显著降低数据中心空调需求,同时保持高密度 AI 基础设施的最佳运行温度。

冷却软管套件

柔性软管套件专为将液冷机架直接连接到数据中心主供水系统或冷却塔而设计。预装软管套件支持即插即用,无需工具即可轻松部署,并可无缝集成到新建或现有设施的管道系统中。

电源架和 BBU

33kW 电源架专为最新一代高密度 AI 机架而设计,并配备电池备用单元,可在断电期间提供 90 秒的 48V 直流电源,用于应用程序检查点,从而无需完全重启应用程序。

网络交换机

NVIDIA 以太网和InfiniBand 包括 NVIDIA Spectrum-X 和 Quantum-2 在内的平台,用于优化 AI 集群网络,以及合格的合作伙伴解决方案。 Supermicro 我们还提供链路速度高达 800 GbE、吞吐量高达 51.2 Tbps 的以太网交换机,以满足不同的工作负载需求。

行内解决方案

利用专为多机架部署而设计的灵活行内解决方案,扩展您的液冷基础设施。 Supermicro 行内式冷配机组 (CDU) 可在多个机架上提供高达 1.8MW 的冷却能力,而液冷式侧挂机组 (Sidecar) 则可在无需外部基础设施改造的情况下提供高达 200kW 的独立冷却能力。为了实现完整的交钥匙部署,SuperCluster 提供预验证的即插即用型多机架解决方案,集成网络架构并经过严格的 L11/L12 测试,从而能够从试点项目无缝扩展到全面生产。

了解更多

Supermicro 连续集锦

货架

Supermicro品牌机架提供一站式端到端平台——从机架结构和系统集成到冷却系统准备和工厂验证。凭借完整的内部工程和制造能力,每个机架均按照严格的质量标准打造,同时确保与整个系统无缝兼容。

行内 CDU

大容量行内冷却剂分配装置可容纳多个大功率液冷服务器机架,提供高达 1.8MW 的冷却能力,适用于密集人工智能数据中心环境中的可扩展多机架部署。

液-气(L2A)侧挂式 CDU

独立冷却装置可在数据中心内将服务器中的热液体转换回冷却液体,提供高达 200 千瓦的冷却能力,无需对外部基础设施进行改造,是改造和快速部署液冷系统的理想之选。

超级集群

高度可定制、即插即用的集群解决方案,配备多个机架和集成网络结构。每个系统在发货前都经过严格的 L11 或 L12 验证测试,确保交钥匙部署,实现从试点项目到全面生产型人工智能基础设施的无缝扩展。

场地基础设施解决方案

利用全套工程设计的布线、电力和冷却基础设施,构建高性能数据中心基础架构。 Supermicro 提供优化的布线设计和实施方案,并提供完整的文档,包括布线方案、端口映射和线缆长度优化,从而缩短上线时间、降低材料成本和人工成本。针对现场级散热管理, Supermicro 提供可扩展配置的水冷塔和无需用水的干式冷却塔——所有产品均设计易于安装,并可随着基础设施的增长而并行扩展。

了解更多

Supermicro DCBBS网站基础设施拍摄

水冷塔

一次液体循环设备支持从 1 兆瓦到 50 兆瓦或更大的可扩展冷却能力,采用模块化设计,可加快运行时间。闭环系统采用 EC 风扇设计和 N+1 潜水泵,与传统的风冷系统相比,可确保高能效、可靠的运行,并减少电力和水的使用。

干式冷却器

为用水紧张地区提供低 PUE/WUE 冷却,容量可从 1 MW 扩展到 50 MW 以上。绝热辅助模式可实现空气预冷,在高温环境下性能卓越。闭环设计可保持冷却剂清洁无腐蚀,确保卓越的效率、最少的维护和长期的可靠性。

电池储能系统(BESS)

这款独立式液冷储能解决方案容量为 1.5 MW/3.1 MWh,专为关键任务型 AI 数据中心量身打造。采用安全可靠的磷酸铁锂电池,并配备先进的电池级管理、多层防火屏障、洁净气体抑制和防爆功能,确保最高的安全性和可靠性;同时,削峰和功率平滑功能可降低能源成本,并稳定波动的 AI 工作负载。

布线

优化流量工程,提供完整的布线设计、文档和实施服务,包括路由选择、端口映射和电缆长度优化。工程解决方案可缩短上线时间、降低材料成本和人工成本,同时确保多机架部署的高性能数据流。

管理软件套件

从裸机到 AI 工作负载,作为数据中心构建模块解决方案的一部分,SuperCloud 软件套件可为现代数据中心提供端到端的管理。统一基础架构控制、自动化部署管道、通过自助式人工智能工具增强开发人员的能力,以及优化多租户 GPU 云操作--所有这些都是专为人工智能工厂和超大规模环境的规模和复杂性而构建的。

了解更多

屏幕截图 - SuperCloud Composer®( SCC )屏幕截图 - 超级云自动化中心(SCAC)截屏 - SuperCloud Developer Console ( SDX )屏幕截图 - 超级云总监 (SCD)

超级云计算作曲家® (SCC)

SuperCloud Composer 提供跨服务器、网络、PDU、CDU 和第三方系统的统一机架规模和液体冷却管理。它提供电源管理、高级泄漏检测、保护和警报,以保护 GPU 和冷却基础设施。SuperCloud Composer 具有大规模可观察性和可调整性,可通过单一门户管理 20K+ 主机。

超级云自动化中心(SCAC)

SuperCloud Automation Center 提供预构建的企业级数据中心和边缘基础设施自动化解决方案。它涵盖从固件和操作系统配置到 Kubernetes 和 AI 工作负载启用等各个方面,同时确保安全性、可扩展性和治理能力。

SuperCloud Developer Console ( SDX )

SuperCloud 开发者控制台是面向开发者的人工智能体验控制台,它将 GPU 即服务(GPUaaS)、 Kubernetes、机器学习管道和数据服务整合到一个工作区中。与其他仅提供基础架构的控制台不同,它通过自助式调配、AI 原生工作流和内置的可观察性,为开发人员提供交钥匙敏捷性,使团队能够更快、更安全地完成从代码到模型的转换。

超级云总监 (SCD)

SuperCloud Director 通过集成的裸机、以太网和 Infiniband 网络多租户和存储管理,提供多租户 AI 云控制,优化性能、安全性和开发人员敏捷性。与一般的云管理工具不同,该软件专为 GPU 即服务(GPUaaS)、AI 工厂部署和超大规模运营而设计。

服务和现场部署

从规划到持续支持,我们提供全面的专业服务,加速您的数据中心部署。 Supermicro 全球服务提供端到端的专业技术支持,包括数据中心设计、解决方案验证和专业的现场部署——无论您是从零开始建设、改造空冷到液冷系统,还是在托管机房部署,我们都能满足您的需求。我们的一体化解决方案可缩短上线时间,确保更高质量的安装,并提供持续的现场支持和4小时响应选项,保障关键业务的正常运行时间。

了解更多

规划和验证

项目经过周密计划,包括数据中心平面图、机架布局、端口映射等设计。发货前, Supermicro 测试超越了行业标准,包括机架级(L11)和集群级(L12)验证。

现场部署

端到端部署始于Supermicro我们提供尊贵的送货服务,确保产品得到最妥善的照​​料。现场服务团队成员负责货架安装和堆垛,并可选择安装软件。

现场支持

Supermicro 确保部署后平稳过渡,提供完整的文档和持续支持,以确保长期成功。全球服务提供多种选择,最快可在 4 小时内响应现场需求,并提供零部件更换服务。

数据中心装修服务

将数据中心外壳转变为运行环境的交钥匙解决方案。包括设计、工程、许可、从 PDU 到服务器的电气设备、带机架和 CDU 的机械系统以及液体冷却基础设施,以确保完全就绪。

建设服务

扩建服务可显著缩短新建数据中心的工期。 Supermicro 确保裸地建设、数据中心液冷改造的成功,并提供端到端的项目管理。

准备好打造人工智能的未来了吗?

接触Supermicro 今天就开始设计您的下一代人工智能数据中心吧。

联系我们