跳至主要内容

面向人工智能的开源 Spark、数据流、数据工程解决方案

基于开源技术的Supermicro

挑战

从结构化数据、非结构化数据到半结构化数据,不断变化的应用驱动着海量信息。传统的 IT 基础设施无法处理由社交媒体网络、移动应用程序、机器传感器和科学研究等产生的种类繁多、速度快、数量大的数据。对于企业来说,利用大数据分析不再是一个时间问题,而是一个如何利用的问题。Spark 和其他开源软件就是为此而诞生的,它们专为低成本地存储和处理海量数据而设计。它可以线性扩展到数千台服务器和 PB 级存储。

对于能够管理和维护Spark开源实现及其相关数据流与数据工程软件的服务提供商和精通开源技术的客户Supermicro 提供兼具带内与带外管理功能的可靠系统,以及适配客户数据中心的丰富系统平台选择Supermicro Kubernetes集群的部署流程。

解决方案与Supermicro

Supermicro 集群支持开源技术,并简化了Kubernetes部署流程。

  • 系统选择:客户可选择最佳硬件平台来构建集群
    • 机架式Hyper 系统或多节点 Twin 服务器或刀片服务器
    • 可选择 CPU 架构,英特尔或AMD 企业级 CPU
    • 为 Spark 加速等应用选择 GPU 加速器
    • 从 HDD 到 SSD 再到 NVMe 驱动器的磁盘选择
    • 网络架构选择,10GbE 至 400 GbE 选项
    • 所有设备均通过相同的IPMI/Redfish接口进行管理,并可通过单一管理界面的Supermicro Composer进行聚合管理。
    • 许多部署操作可通过Supermicro 云编排器实现自动化。
  • 实施选择:客户可以在裸机实施、Red Hat OpenShift、Kubernetes 或虚拟机实施上进行部署
  • 可扩展性:客户可以从最小的集群开始,然后通过增加服务器进行扩展。
  • 自动化:Supermicro 集群,并通过全面测试确保构建质量与交付进度。软件实施可Supermicro 自动化功能进行部署。

与 Kubernetes 完全集成的开源集群示例

主要特点和优势

  • 专为容量、计算或 IO 性能而优化的集群配置
  • 支持 Kubernetes、OpenShift 和其他 Kubernetes 实施方案
  • 可选择 IntelXeon Scalable 或AMD EPYC CPU - 建议整个集群使用相同的 CPU 架构
  • 高可用性名称节点设计,无单点故障
  • 专为 Spark 和其他内存内、低延迟计算设计的大内存选件
  • Hyper服务器平台专为超大规模部署而设计
  • 高密度计算、存储和内存设计,实现最佳效率和最低总体拥有成本
  • 灵活的网络交换机选项,每个机架可配置 1 或 2x 10G / 25G / 100G 或更高速度的交换机。
  • 经济高效的 14U 机架设计,是概念验证测试环境的理想选择
  • 标准 42U 机架设计和灵活的 PDU 选件可满足任何数据中心环境的需求
  • 高达钛级 (96%+) 效率 - 配备 PMBus 的冗余电源
  • 内置 IPMI 和 SMC OOB(带外管理)套件,用于自动集群管理
  • 与您选择的 Hadoop 发行版完全集成、完全配置和完全测试
  • 概念验证测试集群可提供无风险购买体验
  • 客户提供开源软件的系统映像,客户自我支持
Supermicro 整合Hadoop集群解决方案机架
  • 1 或 2x 48 端口 10G SFP+ / 10GBase-T / 25GbE
    1 或 2x 32 端口 100GbE,1x 48 端口交换机,GbE
  • 1x 管理节点 1U IntelXeon Scalable 或AMD EPYC CPU
  • 3x 名称节点 1U DP IntelXeon Scalable 或AMD EPYC CPU
  • 优化数据节点 2U SSG、2U BigTwin 或 4U FatTwin®,配备 IntelXeon Scalable 或AMD EPYC CPU
  • 标准 42U 机架,配有计量 PDU,可提供机架定制选项
  • 集成服务包括完整的集群预烧和测试、BIOS 和 FW 更新、网络配置、客户提供的开源映像