Présentation du module:

Ce module vise à donner une compréhension approfondie des enjeux et des techniques liées au traitement des données massives (Big Data). Il couvre à la fois les aspects théoriques et pratiques, avec un accent particulier sur les outils et méthodes utilisés en environnement professionnel.

Le cours durera environ 3 heures par semaine pendant 14 semaines, incluant des cours magistraux, des travaux pratiques, des lectures complémentaires et des évaluations. La dernière semaine du cours est consacrée à l’examen final.

La note de TP du module représente 40 % de la note finale, tandis que l’examen final compte pour les 60 % restants. Une note minimale de 50 % est requise pour valider le module.

Objectifs: 

À la fin du cours « Traitement de données massives », les étudiants seront capables de :

  1. Comprendre les concepts fondamentaux liés aux données massives et aux enjeux du traitement à grande échelle.
  2. Décrire les principes du traitement distribué et parallèle appliqués aux données massives.
  3. Concevoir et implémenter des programmes permettant un traitement distribué ou parallèle sur de grands volumes de données.
  4. Mettre en œuvre des solutions de traitement des données en temps réel.
  5. Utiliser les outils et frameworks couramment employés en environnement de production pour le traitement des Big Data.
  6. Déployer et héberger des données massives sur un cluster de machines en respectant les contraintes de performance et de fiabilité.

Contenu du cours:

Chapitre 1 : Paradigme de traitement des données massives 

Chapitre 2 : Écosystème pour le traitement du Big Data 

Chapitre 3 : Intégration des données et création de pipelines 

Chapitre 4 : Traitement des flux de données continus 

Chapitre 5 : Visualisation des données 

Public cible: 4ème année Ingénieur en Informatique (IA)

Pour obtenir le mot de passe, veuillez me contacter à l’adresse suivante : zouaneb.imane@gmail.com