
Présentation du module:
Ce module vise à donner une compréhension approfondie des enjeux et des techniques liées au traitement des données massives (Big Data). Il couvre à la fois les aspects théoriques et pratiques, avec un accent particulier sur les outils et méthodes utilisés en environnement professionnel.
Le cours durera environ 3 heures par semaine pendant 14 semaines, incluant des cours magistraux, des travaux pratiques, des lectures complémentaires et des évaluations. La dernière semaine du cours est consacrée à l’examen final.
La note de TP du module représente 40 % de la note finale, tandis que l’examen final compte pour les 60 % restants. Une note minimale de 50 % est requise pour valider le module.
Objectifs:
À la fin du cours « Traitement de données massives », les étudiants seront capables de :
- Comprendre les concepts fondamentaux liés aux données massives et aux enjeux du traitement à grande échelle.
- Décrire les principes du traitement distribué et parallèle appliqués aux données massives.
- Concevoir et implémenter des programmes permettant un traitement distribué ou parallèle sur de grands volumes de données.
- Mettre en œuvre des solutions de traitement des données en temps réel.
- Utiliser les outils et frameworks couramment employés en environnement de production pour le traitement des Big Data.
- Déployer et héberger des données massives sur un cluster de machines en respectant les contraintes de performance et de fiabilité.
Contenu du cours:
Chapitre 1 : Paradigme de traitement des données massives
Chapitre 2 : Écosystème pour le traitement du Big Data
Chapitre 3 : Intégration des données et création de pipelines
Chapitre 4 : Traitement des flux de données continus
Chapitre 5 : Visualisation des données
Public cible: 4ème année Ingénieur en Informatique (IA)
Pour obtenir le mot de passe, veuillez me contacter à l’adresse suivante : zouaneb.imane@gmail.com
- Enseignant: Imane Zouaneb DZ