Programme de la formation
Apprendre à récupérer, nettoyer et intégrer les données textes afin de mieux connaître les besoins clients.
Source de données
- Données internes
- Reconnaissance optique de caractères
- Données des sites d’avis
- Manipulation des documents html
- Technique de webscraping
Transformation des données
- Manipulation des chaînes de caractères
- Manipulation des expressions régulières
- Construction de corpus
- Matrice Documents-termes
- TD IDF
Nettoyage des données textes
- Distance entre les chaînes de caractères et correction de fautes d’orthographe
- Principe de géocodage
- Détection d’anomalies
Machine learning
- Clusterint des chaînes de caractères
- Classification de spams
- Caractérisation des avis par une note et sa prédiction
- Segmentation des avis
Visualisation
- Tableau de bord
- Nuage de mots
- Fréquence des mots ou biogrammes
Cas d’application
- Webscraping
- Analyse des avis clients
- Analyse du NPS
- Correction des fautes d’orthographe
- Géocodage
Une formation de notre expert Kezhan SHI, dont nous vous invitons à découvrir le blog.