在虛擬化環境中能否使用 GPU 擴展？

是的。現代虛擬化平台支援 GPU 直通技術與多實例 GPU（MIG），使 GPU 資源得以在資料中心與雲端環境中的虛擬機器間進行共享或擴展。

GPU擴展如何影響能源效率？

透過將平行工作負載卸載至GPU，系統得以更快完成任務並減少資源消耗，從而提升每瓦效能並降低資料中心的整體能源消耗。

所有應用程式都能從GPU擴展中受益嗎？

應用程式必須經過設計或優化以支援平行處理，方能充分發揮GPU的擴展優勢。AI、HPC處理等工作負載能實現良好擴展，而串行任務則可能無法獲得顯著效益。

何謂GPU擴展？

GPU 擴展

GPU擴展指的是運用圖形處理器（GPU）來加速並擴展運算密集型工作負載效能的過程。在企業環境中，GPU擴展能透過將任務分配至多個GPU核心或節點，使系統得以處理更龐大的資料集、訓練更深層的機器學習模型、渲染複雜的視覺化內容，以及管理高吞吐量的視訊串流。此擴展機制既可於單一系統內實現，亦能在現代化資料中心的GPU叢集間跨域達成。

需特別注意的是，在消費性情境中，「GPU縮放」一詞亦可指為匹配顯示解析度而調整畫面比例。然而在企業與資料中心應用中，GPU縮放主要指透過GPU加速實現的效能擴展。

GPU 擴展機制如何運作

GPU擴展技術透過將運算任務分配至一顆或多顆GPU來加速效能，並處理更龐大或更複雜的工作負載。此機制既可應用於配備多顆GPU的單一伺服器內，亦可部署於分散式系統中——在該系統中，GPU經由集群與互連技術整合為統一運算資源。

GPU擴展的核心在於平行處理。與CPU不同，後者擁有少量針對序列處理優化的強大核心，GPU則內含數千個較小的核心，專為同時執行多項運算而設計。這使其成為深度學習推論與訓練、研發模擬、3D渲染以及即時視訊轉碼等任務的理想選擇。

垂直擴展

垂直GPU擴展是指在單一系統中添加更強大或額外的GPU。此方法可提升運算密度，特別適用於CPU 之間具備大容量記憶體頻寬，以及快速GPU內部通訊的高效能工作負載。

水平擴展

水平GPU擴展技術透過高速網路連接多個具備GPU功能的系統或節點。此方法允許在多台伺服器上進行分散式訓練與處理，實現資料中心或叢集層級的擴展能力。常見技術如NVIDIA NVLink、InfiniBand及融合乙太網路上的即時通訊協定（RoCE），皆用於支援高吞吐量、低延遲的互連架構。

軟體編排

工作負載擴展透過專用軟體堆疊與框架進行管理。CUDA、OpenCL及廠商優化函式庫負責任務執行，而具備GPU感知調度功能的Kubernetes等編排工具則能高效地在節點間分配工作負載。這些平台確保資源能動態分配以滿足工作負載需求，同時維持效能與可靠性。

GPU擴展所需的基礎架構與硬體要求

在企業環境中啟用GPU擴展功能，需要專門設計的系統以滿足現代加速器對高功率需求、熱管理及數據吞吐量的嚴苛要求。硬體架構必須支援高密度運算、高效散熱策略及低延遲互連技術，方能確保可擴展的性能表現。

機架式伺服器是常用的GPU擴展系統。這些平台通常高度介於1U至4U之間，可容納多張高效能GPU，例如NVIDIAAMD MI300。

高密度多GPU系統經過優化，旨在實現每機架單位的最大效能。此類伺服器可在單一機箱內容納多達10張或更多GPU，廣泛應用於AI 訓練、科學計算及即時分析領域。密集型GPU配置需透過精密的系統設計，方能確保在負載狀態下維持熱平衡與穩定效能。

Blade 與模組化系統為GPU部署提供靈活方案。此類架構將運算、儲存與網路功能拆分為模組化元件，使資料中心能依據特定工作負載需求彈性擴展資源。集中式冷卻與管理功能更支援大規模部署環境中更高效的運作。

隨著GPU功耗與密度提升，傳統風冷可能難以勝任。在高性能運算環境中，液冷解決方案正日益普及，用以有效管理熱量並維持系統穩定性。此類方案亦有助於提升大規模部署的能源效率與永續性。

高速互連技術在實現跨節點的水平GPU擴展中扮演關鍵角色。諸如InfiniBand、RoCE（融合乙太網上的RDMA）及NVLink等技術，能支援分散式訓練、即時模擬及其他平行運算任務所需的低延遲、高頻寬通訊。

GPU擴展的應用場景與效益

在現代運算環境中，GPU擴展性扮演著關鍵角色，其性能、效率與可擴展性至關重要。透過運用GPU進行資料並行處理，企業能顯著提升各類工作負載的吞吐量，並大幅縮短處理時間。

人工智慧與機器學習

訓練深度學習模型通常需要龐大的運算能力與大量數據集。GPU擴展技術允許多個GPU協同運作，不僅能加速訓練時間，更能實現具備數十億參數的模型。這項技術在自然語言處理、電腦視覺及生成式AI領域尤為關鍵。

高效能運算（HPC）

在科學研究、工程設計與模擬領域中，GPU擴展能力支援複雜數學建模、分子動力學、天氣預報及計算流體動力學等應用。這些工作負載能充分利用GPU提供的平行運算能力與記憶體頻寬優勢。

即時視訊處理與串流

GPU擴展對於高解析度影片轉碼、即時渲染及串流工作負載至關重要。媒體公司運用GPU加速系統同時處理多路影片串流，確保低延遲與高品質輸出。

數據分析與視覺化

大規模分析平台採用GPU加速技術，使其處理大型資料集的速度超越CPU系統。在金融、醫療保健及網路安全等領域，GPU擴展能力可實現快速數據分析、即時視覺化呈現，並加速決策過程。

提升效率與降低總持有成本

透過將平行任務卸載至GPU，系統在每項操作中消耗的電力更少，同時實現更高的每瓦效能。這不僅提升資源利用效率，更降低總擁有成本（TCO），尤其在資料中心環境中成效顯著。

常見問題

GPU 擴展能否用於虛擬化環境？
可以。現代虛擬化平台支援 GPU 直通技術與多實例 GPU（MIG），使 GPU 資源得以在資料中心與雲端環境中的虛擬機器間共享或擴展。
GPU擴展如何影響能源效率？
透過將平行工作負載卸載至GPU，系統能以更少資源更快完成任務，從而提升每瓦效能並降低資料中心的整體能源消耗。
所有應用程式都能從GPU擴展中受益嗎？
應用程式必須經過平行處理的設計或優化，才能充分發揮GPU擴展的優勢。AI、HPC處理等工作負載能實現良好擴展，而串行任務則可能無法獲得顯著效益。

機架式伺服器

1U雙處理器

2U雙處理器

單一處理器

多處理器

產品系列

GPU伺服器

8U/10U GPU系列

4U/5U GPU系列

2U GPU系列

1U GPU產品線

Twin伺服器

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

Blade伺服器

SuperBlade®

MicroBlade®

MicroCloud

儲存伺服器

所有儲存系統

全快閃NVMe

頂部裝載式儲存

JBOF

Petascale Grace儲存

企業最佳化儲存系統

JBOD儲存機箱

主機板

伺服器主機板

工作站主機板

嵌入式 / IoT主機板

桌上型 / 電競主機板

主機板系列

全球SKU

機殼

1U機箱

2U機箱

3U機箱

4U / 塔式機箱

中型 / 迷你立式機型

嵌入式 / 物聯網機箱

移動式貨架 / 驅動套件

JBOD儲存機箱

全球SKU

SuperRack®

資料中心解決方案工程（DCSE）

機架整合服務

配件裝置

各式電源線/連接線

Riser卡系列

儲存AOC系列

電源供應器系列

散熱器系列

系統風扇系列

移動式貨架 / 驅動套件

前機箱邊框

儲存、輸入/輸出、安全性

邊緣AI與物聯網系統

緊湊型邊緣系統

緊湊型邊緣伺服器

機架式邊緣伺服器

嵌入式元件

嵌入式主機板

嵌入式機箱

交換器

轉接器

SuperWorkstations

液冷式AI開發平台

單處理器

雙處理器

Supero™ Gaming解決方案

人工智慧基礎架構

資料中心建構組件解決方案（Data Center Building Block Solutions®，DCBBS）

AI工廠

邊緣AI

AI儲存

NVIDIA解決方案

AMD解決方案