Spark、Hadoop、数据流处理、面向人工智能的数据工程解决方案
Supermicro 和 Cloudera 解决方案

挑战
不断变化的应用程序驱动着海量信息产生,涵盖结构化、非结构化及半结构化数据。传统IT基础设施无法应对社交媒体网络、移动应用、机器传感器及科研项目等产生的数据多样性、高速性和海量性。对企业而言,运用大数据分析已不再是"何时"的问题,而是"如何"的问题。 Spark、Hadoop等开源软件正是为此而生,它们专为高效存储和处理海量数据而设计,可线性扩展至数千台服务器和数千兆字节的存储空间。
Cloudera 集成这些开源技术并提供企业级支持,以帮助客户从海量数据中获得竞争优势。为此,Cloudera 部署在可扩展的服务器集群中。Supermicro 通过提供具备带内和带外管理功能的可靠系统,并提供多种适合客户数据中心的系统平台选择,从而简化了 Cloudera 集群的部署。
解决方案与 Supermicro 优势
Supermicro 服务器集群通过简化部署支持 Cloudera Cloud Data Platform (CDP)。
- 系统选择:客户可选择最佳硬件平台来构建集群
- 机架式Hyper 系统或多节点 Twin 服务器或刀片服务器
- 可选择 CPU 架构,英特尔或AMD 企业级 CPU
- 为 Spark 加速等应用选择 GPU 加速器
- 从 HDD 到 SSD 再到 NVMe 驱动器的磁盘选择
- 网络架构选择,10GbE 至 400 GbE 选项
- 均由相同的 IPMI/Redfish 接口管理,并可通过单一管理平台 Supermicro Cloud Composer 进行聚合。
- 许多部署都可以通过 Supermicro Super Cloud Orchestrator 实现自动化。
- 实施选择:客户可以在裸机实施、Red Hat OpenShift、Kubernetes 或虚拟机实施上进行部署
- 可扩展性:客户可以从最小的集群开始,然后通过增加服务器进行扩展。
- 自动化:Supermicro 可以构建集群,经过全面测试,并保证构建质量和交付时间。软件实施可利用 Supermicro Cloud Orchestrator 的自动化功能进行部署。

或
用于 VMware 部署或使用 GPU 的 Supermicro 服务器
资源
