Aller au contenu principal

Spark, Hadoop, Data Streaming, Solutions d'ingénierie des données pour l'IA

Solutions Supermicro Cloudera

Le défi

Les applications en constante évolution génèrent une énorme quantité d'informations, qu'il s'agisse de données structurées, non structurées ou semi-structurées. L'infrastructure informatique conventionnelle n'est pas conçue pour gérer la variété, la vitesse et le volume des données produites par les réseaux de médias sociaux, les applications mobiles, les capteurs de machines et les recherches scientifiques, etc. Pour les entreprises, l'utilisation de l'analyse des big data n'est plus une question de temps, c'est une question de méthode. Spark, Hadoop et d'autres logiciels libres, conçus pour le stockage et le traitement rentables de grands volumes de données, sont nés dans ce but. Ils peuvent évoluer linéairement jusqu'à des milliers de serveurs et des pétaoctets de stockage.

Cloudera integrates these open-source technologies and provides enterprise level support to help customers gain competitive edge from the large amount of data. To do so, Cloudera is deployed in scalable server clusters. Supermicro simplifies Cloudera cluster deployment with reliable systems that have both in-band and out-of-band management and by offering a wide choice of system platforms that fit into customers data centers.

La solution et Supermicro

Supermicro server clusters support Cloudera Cloud Data Platform (CDP) with simplified deployment.

  • CHOIX DU SYSTÈME: Les clients peuvent choisir la meilleure plate-forme matérielle pour construire des clusters.
    • Systèmes Hyper montés en rack ou serveurs Twin à plusieurs nœuds, ou serveurs Blade
    • Choix d'architectures de CPU, soit des CPU d'entreprise Intel ou AMD
    • Choix d'accélérateurs GPU pour des applications telles que l'accélération Spark
    • Choix de disques, du HDD au SSD en passant par les disques NVMe
    • Choix d'architectures de réseau, options de 10GbE à 400 GbE
    • Tout est géré par les mêmes interfaces IPMI / Redfish et peut être agrégé par le Supermicro Composer à panneau unique.
    • Une grande partie du déploiement peut être automatisée à l'aide de Supermicro Cloud Orchestrator.
  • CHOIX DE MISE EN ŒUVRE: les clients peuvent déployer sur une mise en œuvre bare-metal, Red Hat OpenShift, Kubernetes, ou sur des mises en œuvre de machines virtuelles.
  • ÉVOLUTION: les clients peuvent commencer avec le plus petit cluster et évoluer en ajoutant des serveurs.
  • AUTOMATISATION: Supermicro construire le cluster, entièrement testé avec une qualité de construction et un calendrier de livraison garantis. La mise en œuvre du logiciel peut être déployée à l'aide des fonctionnalités d'automatisation de Supermicro Orchestrator.

Exemple de cluster Cloudera CDP entièrement intégré

Principales caractéristiques et avantages :

  • Configurations de clusters spécifiques optimisées pour la capacité, le calcul ou la performance IO
  • Choix de CPU Intel Xeon Scalable ou AMD EPYC - il est recommandé d'utiliser la même architecture de CPU pour l'ensemble du cluster.
  • Conception de nœuds de nom à haute disponibilité, sans point de défaillance unique
  • Grandes options de mémoire conçues spécifiquement pour Spark et d'autres calculs en mémoire et à faible latence
  • Plateformes de serveurs Hyper conçues pour les déploiements de très grande envergure
  • Conception à haute densité de calcul, de stockage et de mémoire pour obtenir la meilleure efficacité et le coût total de possession le plus bas.
  • Options de commutation réseau flexibles avec 1 ou 2 commutateurs 10G / 25G / 100G ou plus rapides par rack.
  • Conception rentable en rack 14U, idéale pour un environnement de test de validation du concept
  • Conception de rack standard 42U et options PDU flexibles pour répondre à tous les environnements de centres de données
  • Efficacité jusqu'au niveau Titanium (96%+) - Alimentations redondantes avec PMBus
  • Intégrée avec IPMI et la suite SMC OOB (out of band management) pour une gestion automatisée des clusters.
  • Entièrement intégré, entièrement configuré et entièrement testé avec les distributions Hadoop de votre choix
  • La grappe d'essai de la preuve de concept est disponible pour une expérience d'achat sans risque.
  • Support Cloudera Enterprise, sous licence Cloudera
Rack de solution de cluster Hadoop Supermicro intégré Supermicro
  • 1 ou 2x 48 ports 10G SFP+ / 10GBase-T / 25GbE
    1 ou 2x 32 ports 100GbE, 1x 48 ports Switch, GbE
  • 1x Management Node 1U Intel Xeon Scalable ou AMD EPYC CPUs
  • 3x Name Nodes 1U DP Intel Xeon Scalable ou AMD EPYC CPUs
  • Nœuds de données optimisés 2U SSG, 2U BigTwin ou 4U FatTwin® avec CPU Intel Xeon Scalable ou AMD EPYC
  • Rack standard 42U avec PDU mesurées, options de personnalisation du rack disponibles
  • Le service d'intégration comprend le rodage et le test complet du cluster, la mise à jour du BIOS et du FW, la configuration du réseau, la pré-installation de la distribution Cloudera CDP de votre choix et le cluster complet.
Supermicro

Supermicro pour déploiements Bare Metal ou Kubernetes

Serveurs CloudDC 1U ou

Serveurs GrandTwin® multi-nœuds

OU

Supermicro pour le déploiement VMware ou l'utilisation de GPU

Hyper serveurs 2U