跳至主要內容

Spark、Hadoop、資料串流、資料工程解決方案,為AI

Supermicro Cloudera 解決方案

挑戰

不斷變化的應用程式驅動了大量資訊,從結構化、非結構化到半結構化資料。傳統的 IT 基礎架構無法處理社交媒體網路、行動應用程式、機器感測器和科學研究等所產生的資料種類、速度和數量。對於企業而言,運用大數據分析已不再是何時的問題,而是如何運用的問題。Spark、Hadoop 及其他開放原始碼軟體,專為低成本儲存及處理大量資料而設計,正是為此目的而誕生。它可以線性擴充至上千台伺服器和 PB 級的儲存空間。

Cloudera 整合這些開源技術並提供企業級支援,協助客戶從海量數據中取得競爭優勢。為實現此目標,Cloudera 部署於可擴展的伺服器叢集。Supermicro 透過具備頻內與頻外管理功能的可靠系統,以及提供多種適用於客戶資料中心的系統平台選擇Supermicro Cloudera 叢集的部署流程。

解決方案與Supermicro

Supermicro 叢集支援 Cloudera Cloud Data Platform (CDP),並提供簡化的部署方案。

  • 系統選擇:客戶可以選擇最佳的硬體平台來建立群集
    • 機架式Hyper 系統或多節點 Twin 伺服器,或Blade
    • CPU 選擇,可選用英特爾或AMDAMD 級CPU
    • 為 Spark 加速等應用選擇 GPU 加速器
    • 從 HDD 到 SSD 再到 NVMe 硬碟機的磁碟選擇
    • 可選擇的網路架構、10 GbE 至 400 GbE 選項
    • 所有設備皆透過相同的IPMI/Redfish介面進行管理,並可透過單一管理介面的Supermicro Composer進行整合管理。
    • 許多部署作業可透過Supermicro Cloud Orchestrator 實現自動化
  • 實作選擇:客戶可在裸機實作、Red Hat OpenShift、Kubernetes 或虛擬機器實作上進行部署。
  • 可擴充性:客戶可以從最小的群集開始,然後透過增加伺服器來擴充。
  • 自動化:Supermicro 叢集,並透過完整測試確保建置品質與交付時程。軟體部署可運用Supermicro Orchestrator 的自動化功能進行實施。

完全整合的 Cloudera CDP 集群範例

主要功能與優勢:

  • 專為容量、運算或輸入輸出效能所優化的專用叢集配置
  • 可選用 IntelXeon 或AMD EPYC - 建議整個叢集採用相同的CPU
  • 高可用性名稱節點設計,無單點故障
  • 專為 Spark 及其他內存運算、低延遲運算設計的大型記憶體選項
  • 專為超大規模部署設計的Hyper伺服器平台
  • 高密度運算、儲存與記憶體設計,以實現最佳效能與最低總持有成本
  • 靈活的網路交換器選項,每個機架可配置 1 或 2 個 10G / 25G / 100G 或更高速的交換器。
  • 經濟實惠的14U機架設計,適用於概念驗證測試環境
  • 標準42U機架設計與靈活的PDU選項,滿足任何資料中心環境需求
  • 鈦級效率(96%+)—— 配備PMBus的冗餘電源供應器
  • 內建 IPMI 與 SMC OOB(帶外管理)套件,實現自動化叢集管理
  • 與您選擇的 Hadoop 發行版完全整合、完全配置並徹底測試
  • 概念驗證測試叢集現已開放,提供零風險的採購體驗
  • Cloudera 企業支援,授權自 Cloudera
Supermicro Hadoop 叢集解決方案機架
  • 1 或 2 個 48 埠 10G SFP+ / 10GBase-T / 25GbE
    1 或 2 台 32 埠 100GbE 交換器,1 台 48 埠 交換器,GbE
  • 1x 管理節點 1U IntelXeon Scalable 或AMD EPYC CPU
  • 3x 名稱節點 1U DP IntelXeon Scalable 或AMD EPYC CPU
  • 最佳化資料節點 2U SSG、2U BigTwin 或 4U FatTwin® 配備 IntelXeon Scalable 或AMD EPYC CPU
  • 標準42U機架配備計量式PDU,提供機架客製化選項
  • 整合服務包括完整的群集燒機與測試、BIOS 與 FW 更新、網路組態、預先安裝 Cloudera CDP 所選的發行版,以及完整的群集