Programme de la formation
La qualité des données est une problématique importante. Si ce critère n’est pas rempli, même les meilleures techniques d’analyse de données seront incomplètes, biaisées, voire erronées. C’est ce qu’on appelle : garbage in garbage out.
Dans ce projet, nous allons cibler les données issues de la saisie libre présentant diverses erreurs.
Le parcours défini est le suivant :
- Description et exploration des données fournies
- Principe de la normalisation d’adresses
- Nettoyage des données textuelles
- Cartographie