Programme de la formation
Introduction à la programmation avec R
- Installation de R et de RStudio
- Présentation de RStudio
Collecte des données web avec R
- Import des données
- Bases de la structure des pages web
- Scraping des données html avec R
- Cas d’application : analyse des avis et notations des produits
- Import et analyse des données de twitter
- Construction d’un outil de veille pour les produits ou les services
Nettoyage de données html et textes
- Text mining
- Manipulation des corpus avec R
- Exploitation des document term matrix (DTM)
- Association des mots
- Visualisation des nuages de mots
Machine learning avec R
- Analyse prédictive des mails indésirables
- Pratique de différents algorithmes avec R
- Application d’un arbre de classification
- Application de SVM (Support Vector Machine)
- Application de la régression logistique
- Agrégation de modèles
- Comparaison des différents algorithmes
Performance des algorithmes
- Matrice de confusion et taux d’erreur
- Courbe ROC et AUC
- Coefficient de Gini
Conclusions
- Intérêt de l’analyse des données textes
- Intérêt du processus d’analyse prédictive
Une formation de notre expert Kezhan SHI, dont nous vous invitons à découvrir le blog.