Objectif

Maitriser les processus et techniques de base pour identifier et résoudre des problèmes de qualité des données.

Contenu

Connaissance des données (entre autres : complexité, qualité, quantité, actualisation, types, formats, sources). Identification et résolution des problèmes de qualité des données. Préparation et prétraitement des données (entre autres : profilage, filtrage, nettoyage, standardisation et normalisation, transformation, ingénierie des caractéristiques, réduction de dimension). Exigences, critères, et métriques de qualité des données.

Formules pédagogiques

Leçons magistrales, travaux pratiques, exercices, étude de cas.

Horaire

Consulter l'horaire de ce cours