AI 基礎設施伺服器解決方案

大規模AI 訓練與推論

大型語言模型、生成式AI 、自動駕駛、機器人技術

大規模AI 需要尖端技術來最大化GPU的平行運算能力，以處理數十億甚至數兆AI 參數，並運用龐大的資料集進行訓練。透過整合NVIDIA的HGX™B200與GB200 NVL72，搭配具備高達1.8TB/s頻寬的最快NVLink®與NVSwitch®GPU-GPU互連技術，以及為節點叢集提供每顆GPU最快1:1網路連接，這些系統專為從零訓練大型語言模型並服務數百萬同時使用者而優化。透過全快閃 NVMe 儲存建構高效能AI 管道，我們提供具備液冷選項的完整整合式機架，確保快速部署與流暢的AI 體驗。

工作負載規模

特大號
大型
中型
儲存

超大型工作負載規格：NVIDIA GB200 NVL72 搭配Supermicro — NVIDIA GB200 NVL72 搭配Supermicro
了解更多

大型工作負載規格：配備 HGX B200 8 GPU 或 HGX H200 8 GPU 的 10U/8U 8 GPU 系統 — 配備 NVIDIAHGX B200 8 GPU的 10U 系統與配備HGX H200 8 GPU的 8U 系統
了解更多

資源

HPC/AI

工程模擬、科學研究、基因體定序、藥物發現

可助力加速科學家、研究人員和工程師的研發時間，同時，越來越多的HPC工作負載正在強化機器學習演算法，以及透過GPU加速的平行運算，以更快獲得成果。目前，全球許多最快的超級運算叢集都運用到GPU和AI技術。

HPC工作負載通常需要進行資料密集型模擬與分析，並需要處理大量的資料集，以及提供高度精準性。GPU（如NVIDIA H100/H200）可提供前的雙精確度效能，且每GPU效能可達60 teraflops。Supermicro的高彈性HPC平台能支援多組GPU與CPU，確保在多種密集型機體規格內運行，並可進行機架規模整合與搭配液體冷卻技術。

NVIDIA® HGX H100/H200 圖形處理器 — HGX H100/H200、H100 NVL 與 H200 NVL

NVIDIA® H100 NVL/H200 NVL 圖形處理器 — HGX H100/H200、H100 NVL 與 H200 NVL

NVIDIA® Grace Hopper Superchip — Grace Hopper Superchip

NVIDIA® RTX PRO™ 6000 Blackwell 圖形處理器 — RTX PRO™ 6000 Blackwell

工作負載規模

大型
中型

大型工作負載規模：8U SuperBlade® — 8USuperBlade®
了解更多

中等工作負載規模：4U/5U 機箱，配備8-10張GPU PCIe擴充卡 — 4U/5U 8-10 GPU PCIe
了解更多

中型工作負載大小：1U Grace Hopper系統 — 1UGrace Hopper
了解更多

資源

企業級AI 推論與訓練

生成式AI推論、AI服務/應用程式、聊天機器人、推薦系統、商業自動化

生成式AI技術已成為科技、銀行、媒體等各類產業的全新趨勢。因AI技術是孕育創新、大幅提升生產力、簡化營運、以資料為導向的決策，以及改善客戶體驗的源頭，AI應用賽道已開啟序章。

無論是AI應用程式與商業模式、用於客戶服務的智慧化擬真聊天機器人，或是AI協同的程式碼生成與內容創作，企業都可以運用開放式架構、程式庫、預先訓練的AI模型相關技術，並透過自有資料集，依據特殊專案需求，對這些架構、程式庫和模型進行微調。許多企業已開始打造AI基礎設施，而Supermicro多元的GPU最佳化系統可為這些企業提供開放式模組化架構、供應商靈活性，以及順暢的部署與設施升級途徑，進而導入更先進的技術。

工作負載規模

特大號
大型
中型

中等工作負載規模：6U SuperBlade® — 6USuperBlade®
了解更多

中等工作負載規模：2U Grace MGX 系統 — 2U Grace MGX 系統
了解更多

資源

視覺化與設計

即時協作、3D設計、遊戲開發

現今的GPU為3D圖形與AI應用程式提升了逼真度，進而加速工業的數位化。高真實度的3D模擬技術推動了產品開發與設計流程、製造，以及內容創作的轉型，進一步實現更好的品質、無機會成本的永續迭代，以及更快的上市時間。

Supermicro全面整合解決方案，大規模建構虛擬製作基礎架構以加速產業數位化進程。解決方案包含：4U/5U 8-10 GPU系統、NVIDIAOVX™參考架構（針對NVIDIA Omniverse Enterprise進行優化並配備通用場景描述(USD)連接器），以及NVIDIA認證的機架式伺服器與多GPU工作站。

工作負載規模

大型
中型

資源

內容傳遞與虛擬化

內容傳遞網路（CDN）、轉碼、壓縮、雲端遊戲／串流

視訊傳輸工作負載至今仍佔當今網際網路流量的重要比例。隨著串流服務供應商日益提供4K乃至8K畫質內容，或更高刷新率的雲端遊戲服務，搭載媒體引擎的GPU加速技術已成為串流管道的必要解決方案。此技術不僅能實現串流管道數倍的吞吐量效能，更藉由AV1編解碼等尖端技術，在提升視覺保真度的同時有效降低所需傳輸數據量。

Supermicro的多節點與多GPU系統，例如2U 4節點BigTwin®系統，能滿足現代視訊傳輸的嚴苛需求。每個節點皆支援NVIDIA L4 GPU，並具備充足的PCIe Gen5儲存與網路傳輸速度，足以驅動內容傳輸網路中要求嚴苛的資料傳輸管道。

工作負載規模

大型
中型
小

資源

邊緣AI

邊緣視訊轉碼、邊緣推論、邊緣訓練

在不同產業內，不少企業的員工與客戶在城市、工廠、零售店、醫院等邊緣地點接觸與互動，其中，越來越多的企業開始投資在邊緣AI的部署。透過在邊緣端處理資料和運行AI和ML演算法，企業能克服頻寬和延遲方面的限制，實現實時分析，進而及時做出決策、預測型看護、個人化服務，以及優化業務運作。

專為環境優化設計AI 具備多種緊湊機型，可提供低延遲、開放架構所需的效能。其預先整合的元件、多元的硬體與軟體堆疊相容性，以及開箱即用的隱私與安全功能集，皆能滿足複雜邊緣部署的需求。

工作負載規模

特大號
大型
中型
小

中等工作負載規模：淺深度多GPU邊緣伺服器 — 短深度多GPU邊緣伺服器
了解更多

資源

精選解決方案

COMPUTEX 2024 執行長主題演講

機架式伺服器

1U雙處理器

2U雙處理器

單一處理器

多處理器

產品系列

GPU伺服器

8U/10U GPU 產品線

4U/5U GPU 產品線

2U GPU 產品線

1U GPU 產品線

雙伺服器

FlexTwin™

BigTwin®

GrandTwin®

雙效®

胖雙胞胎®

Blade伺服器

超級刀鋒®

微刃®

微雲

儲存伺服器

所有儲存系統

全快閃 NVMe

頂部裝載式儲存裝置

JBOF

百億億次級優雅儲存

企業級優化儲存

JBOD儲存機箱

主機板

伺服器主機板

工作站主機板

嵌入式／物聯網主機板

桌上型／電競主機板

主機板矩陣

全球SKU

底盤

1U機箱

2U機箱

3U機箱

4U / 塔式機箱

中塔式／迷你塔式

嵌入式／物聯網機箱

移動式貨架／驅動套件

JBOD儲存機箱

全球SKU

超級機架®

資料中心解決方案工程 (DCSE)

機架整合服務

配件

纜線矩陣

立體卡矩陣

儲存 AOC 矩陣

電源供應矩陣

散熱器矩陣

系統風扇矩陣

移動式貨架／驅動套件

前車架邊框

儲存、輸入/輸出、安全性

邊緣AI與物聯網系統

緊湊型邊緣系統

緊湊型邊緣伺服器

機架式邊緣伺服器

嵌入式元件

嵌入式主機板

嵌入式機箱

開關

轉接器

SuperWorkstations

液冷式AI開發平台

單處理器

雙處理器

Supero™ 電競解決方案

AI

資料中心模組化解決方案®(DCBBS)

AI工廠

邊緣AI

AI

NVIDIA解決方案

AMD 解決方案