Mise en place d'une plateforme Big Data

Introduction au Big Data et mise en place complètement d’une plateforme big data industrialisée, sécurisée et résiliente

Objectif de la formation

Donner aux participants une compréhension approfondie des concepts clés du Big Data, des technologies associées et de la mise en place d’une plateforme complète de Big Data adaptée à leurs environnements.
Ce programme de formation offre une vue d'ensemble complète des concepts, des outils et des techniques du Big Data, tout en permettant aux participants de mettre en pratique leurs compétences grâce à des exercices concrets. Notez que ce programme est adaptable en fonction des besoins spécifiques de votre entreprise, de son environnement et du niveau d'expertise de vos collaborateurs.

s
Modalités

La formation alternera entre des séances théoriques et des ateliers pratiques. Les participants seront encouragés à travailler sur des études de cas réels pour appliquer les concepts appris.

Public cible

Cette formation s’adresse aux professionnels ayant une certaine expérience en informatique et en données, tels que les développeurs, les analystes de données, les ingénieurs en données, les responsables de projets technologiques, les architectes techniques et Administrateurs de plateformes etc.

Prérequis

Une compréhension élémentaire de l’administration Unix ainsi que des concepts de base des bases de données et de l’analyse de données sont recommandées.

JOUR 1:

Introduction 

  • Qu’est ce que le Big Data
  • Comprendre tous les enjeux liés à la Data et à l’ensemble de son cycle de vie

Présentation des types d’architectures

  • Architecture Data Centric,
  • Architecture Data Mesh,
  • Architecture Datalake, type Stockage/Compute

Etude et planification de déploiement d’un cluster CDP

  • Apprendre comment designer et dimensionner son cluster
  • Préparer les prérequis d’installation (hardware et logiciels)

Choix et placement des services d’un cluster CDP 

  • Apprendre à placer convenablement les services hadoop sur les différents noeuds du cluster Cloudera

JOUR 2:

Installation et configuration d’un cluster CDP 

  • Apprendre à installer et configurer les différents services du cluster Cloudera.
  • Lab technique

Gestion et administration des clusters 

  • Apprendre à gérer les clusters de nœuds et à maintenir la disponibilité des services.
  • Lab technique

JOUR 3:

Gestion des données :

  • Apprendre à collecter, manipuler, stocker et analyser les données en utilisant les outils de stockage, d’indexation et d’analyse.
  • Lab technique

Gestion de la sécurité et Authentification

  • Apprendre à mettre en place tous les mécanismes et contrôle de sécurité pour protéger les données et les systèmes (
  • Apprendre à connecter les services du cluster à différents systèmes d’authentification externe ( OpenLdap, FreeIPA)
  • Lab technique

JOUR 4:

Résilience 

  • Apprendre à déployer tous les mécanismes de haute disponibilité des services ( load balancer, haproxy…)
  • Lab technique

Performances et optimisation 

  • Apprendre à optimiser les performances du cluster tout en gérant les ressources en fonction de l’activité applicative
  • Lab technique

JOUR 5:

Monitoring 

  • Apprendre à superviser tous les services du cluster
  • Lab technique

Maintenance et mise à jour

  • Apprendre à effectuer des opérations de maintenance et de mise à jour du système de manière efficace et continue

Troubleshooting

  • Apprendre à investiguer et trouver facilement les solutions aux différents problèmes (applicatif, système) => Méthodologie efficace de troubleshooting