Programme de la formation
Vous souhaitez pratiquer la data science à distance sur une plateforme accessible 24h/24, en support d’un expert pour vous guider dans l’apprentissage ? Ce e-learning est fait pour vous. Apprivoisez de nombreuses techniques de base, et réalisez un cas pratique proche du métier !
-
Introduction à la programmation avec « R »
- Prise en main de R Studio
- Utilisation de R Markdown
- Bases de programmation avec « R »
-
Manipulation des données structurées
- Nettoyage des données
- Manipulation des tables (sélection, filtres, agrégations, jointures)
- Gestion des valeurs manquantes
-
Manipulation des données non structurées
- Introduction au text mining
- Utilisation des expressions régulières
- Transformation des données textuelles
-
Data visualisation
- Types de graphiques
- Introduction à GGPlot2
-
Machine learning
- Algorithmes de classification (arbre de décision, SVM, classification naïve bayésienne)
- Algorithme de régression
- Apprentissage non-supervisé
-
Cas d’application au choix
- Analyse des sinistres et tarification
- Détection de fraude
- Analyse des adresses et géocodage
- Marketing et valeur client
- Analyse des avis clients