Mise en place d'une plateforme Big Data
Introduction au Big Data et mise en place complètement d’une plateforme big data industrialisée, sécurisée et résiliente
Objectif de la formation
Donner aux participants une compréhension approfondie des concepts clés du Big Data, des technologies associées et de la mise en place d’une plateforme complète de Big Data adaptée à leurs environnements.
Ce programme de formation offre une vue d'ensemble complète des concepts, des outils et des techniques du Big Data, tout en permettant aux participants de mettre en pratique leurs compétences grâce à des exercices concrets. Notez que ce programme est adaptable en fonction des besoins spécifiques de votre entreprise, de son environnement et du niveau d'expertise de vos collaborateurs.
Modalités
La formation alternera entre des séances théoriques et des ateliers pratiques. Les participants seront encouragés à travailler sur des études de cas réels pour appliquer les concepts appris.
Public cible
Cette formation s’adresse aux professionnels ayant une certaine expérience en informatique et en données, tels que les développeurs, les analystes de données, les ingénieurs en données, les responsables de projets technologiques, les architectes techniques et Administrateurs de plateformes etc.
Prérequis
Une compréhension élémentaire de l’administration Unix ainsi que des concepts de base des bases de données et de l’analyse de données sont recommandées.
JOUR 1:
Introduction
- Qu’est ce que le Big Data
- Comprendre tous les enjeux liés à la Data et à l’ensemble de son cycle de vie
Présentation des types d’architectures
- Architecture Data Centric,
- Architecture Data Mesh,
- Architecture Datalake, type Stockage/Compute
Etude et planification de déploiement d’un cluster CDP
- Apprendre comment designer et dimensionner son cluster
- Préparer les prérequis d’installation (hardware et logiciels)
Choix et placement des services d’un cluster CDP
- Apprendre à placer convenablement les services hadoop sur les différents noeuds du cluster Cloudera
JOUR 2:
Installation et configuration d’un cluster CDP
- Apprendre à installer et configurer les différents services du cluster Cloudera.
- Lab technique
Gestion et administration des clusters
- Apprendre à gérer les clusters de nœuds et à maintenir la disponibilité des services.
- Lab technique
JOUR 3:
Gestion des données :
- Apprendre à collecter, manipuler, stocker et analyser les données en utilisant les outils de stockage, d’indexation et d’analyse.
- Lab technique
Gestion de la sécurité et Authentification
- Apprendre à mettre en place tous les mécanismes et contrôle de sécurité pour protéger les données et les systèmes (
- Apprendre à connecter les services du cluster à différents systèmes d’authentification externe ( OpenLdap, FreeIPA)
- Lab technique
JOUR 4:
Résilience
- Apprendre à déployer tous les mécanismes de haute disponibilité des services ( load balancer, haproxy…)
- Lab technique
Performances et optimisation
- Apprendre à optimiser les performances du cluster tout en gérant les ressources en fonction de l’activité applicative
- Lab technique
JOUR 5:
Monitoring
- Apprendre à superviser tous les services du cluster
- Lab technique
Maintenance et mise à jour
- Apprendre à effectuer des opérations de maintenance et de mise à jour du système de manière efficace et continue
Troubleshooting
- Apprendre à investiguer et trouver facilement les solutions aux différents problèmes (applicatif, système) => Méthodologie efficace de troubleshooting