
Ce cours se concentre sur l'exploration de données de très grand volume (c'est-à-dire des données qui ne tiennent pas dans la mémoire principale) et sur un certain nombre d'algorithmes spécialement conçus pour être utilisés sur des données massives (telles que des données extraites du Web, par exemple réseaux sociaux, systèmes de recommandation, …). Il explique le principe des systèmes de fichiers distribués et montre Mapreduce comme un outil de création d'algorithmes parallèles.
- Teacher: Imane Zouaneb DZ