Data science avec « R » « pour les nuls »

Cette formation donne 84 points PPC aux membres qualifiés de l’Institut des Actuaires
Dernière mise à jour en novembre 2022

Programme de la formation

Introduction à la programmation avec R

  • Installation de R et de RStudio
  • Présentation de RStudio

Collecte des données web avec R

  • Import des données
  • Bases de la structure des pages web
  • Scraping des données html avec R
  • Cas d’application : analyse des avis et notations des produits
  • Import et analyse des données de twitter
  • Construction d’un outil de veille pour les produits ou les services

Nettoyage de données html et textes

  • Text mining
  • Manipulation des corpus avec R
  • Exploitation des document term matrix (DTM)
  • Association des mots
  • Visualisation des nuages de mots

Machine learning avec R

  • Analyse prédictive des mails indésirables
  • Pratique de différents algorithmes avec R
  • Application d’un arbre de classification
  • Application de SVM (Support Vector Machine)
  • Application de la régression logistique
  • Agrégation de modèles
  • Comparaison des différents algorithmes

Performance des algorithmes

  • Matrice de confusion et taux d’erreur
  • Courbe ROC et AUC
  • Coefficient de Gini

Conclusions

  • Intérêt de l’analyse des données textes
  • Intérêt du processus d’analyse prédictive

 

Une formation de notre expert Kezhan SHI, dont nous vous invitons à découvrir le blog.

Dernière date
9 et 10 décembre 2021
Inscription possible jusqu'à la veille de la formation 16h (hors weekend et jour férié)

EN COURS DE PROGRAMMATION

Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 2100 € HT
  • TVA 20%
  • 2520 € TTC
Lieu

CARITAT, 24 rue Tronchet 75008 PARIS

Durée

2 jours

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Il est diplômé de l'École Centrale Paris et titulaire d'un master en actuariat de l'Université Paris Dauphine. Il a travaillé chez Axa Global Direct et Allianz, avant de rejoindre Diot Siaci en 2022, au titre de Responsable du Data Lab.

Points clés

À qui s’adresse cette formation ?

À toute personne susceptible d’intervenir dans l’élaboration et la mise en oeuvre d’une stratégie Big Data, et ce dans les domaines : produits, marketing, distribution et tarification.

Ainsi qu’à toute personne désireuse de se familiariser avec ce sujet en devenir.

Pour obtenir quoi ?

Une compréhension globale de la problématique Big Data et des outils disponibles à ce jour et nécessaires à son traitement.

Quels objectifs pédagogiques ?

Répondre aux problématiques d’utilisation de R en entreprise.

Maîtriser R pour la manipulation des données et le machine learning.

Présenter les résultats des modèles prédictifs.

Développer les capacités à interpréter le fonctionnement des modèles.

Quelles méthodes mobilisées ?

Des exemples pratiques animeront chaque étape du processus de traitement du Big Data, et complèteront la définition et les perspectives de ce nouveau métier.

Quels sont les prérequis ?

Aucun en particulier. L’intérêt et l’utilisation des outils numériques sont cependant fortement recommandés.

Quelles modalités d’évaluation ?

Une évaluation des acquis des objectifs sera réalisée durant la formation.

 

Chaque participant se munira d’un ordinateur portable pour les travaux pratiques.

Points forts

  • Utiliser R pour des cas pratiques
  • Comprendre le processus complet de traitement des données
  • Astuces et bonnes pratiques concernant l’utilisation des modèles dans une entreprise d’assurance

Témoignages

  • «Formateur à l'écoute et pédagogue. »NP, Chargé d’études statistiques – MACIF
  • «Le programme est en cohérence avec mes attentes. L'exposé a été très clair. »MK, Actuaire – AXA
  • «Le programme est très intéressant et le formateur est passionné. »GL, Responsable de l’actuariat – ADDING
Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations