Qualité des données et Data Science

Cette formation donne 84 points PPC aux membres qualifiés de l’Institut des Actuaires
Dernière mise à jour en novembre 2022

Programme de la formation

Objectifs et enjeux de la qualité des données

  • Types d’anomalies (erreurs de saisies, fautes d’orthographe, erreurs intentionnelles, défaillance du système, etc.)
  • Différents types de risques et d’impacts financiers

Bonnes pratiques et organisation des données

  • Comment mieux organiser les fichiers
  • Comment organiser les données
  • Types de fichiers et de données

Principes de traitements d’anomalies

  • Comment explorer les données pour détecter les valeurs aberrantes
  • Comment traiter les anomalies des variables
    •  numériques
    • catégoriques
    •  textuelles
      • Identifier des clients doublons
      • Identifier les anomalies des adresses (un petit exemple)
      • Incohérences par rapport aux clauses des contrats
  • Calculer un score de vraisemblance

Techniques de data science mises en oeuvre

  • Découvrir comment les techniques de data science permettent de contrôler la qualité des données
    • Webscraping
    • Text-mining
    • Machine learning
    • Analyse des séries temporelles
  • Comment les méthodes clustering permettent de détecter des valeurs aberrantes
  • Comment les méthodes de classifications permettent de calculer un score de qualité

Cas d’application

  • Vérification textuelle (noms clients, adresses, clauses contrats, et autres saisies manuelles de textes)
  • Incohérence de catégories
  • Règles de calculs déterministes
  • Règles multi-critères
  • Segmentation des indicateurs multiples
Dernière date
29 et 30 septembre 2021
Inscription possible jusqu'à la veille de la formation 16h (hors weekend et jour férié)

EN COURS DE PROGRAMMATION

Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 2100 € HT
  • TVA 20%
  • 2520 € TTC
Lieu

CARITAT, 24 rue Tronchet 75008 PARIS

Durée

2 jours

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Il est diplômé de l'École Centrale Paris et titulaire d'un master en actuariat de l'Université Paris Dauphine. Il a travaillé chez Axa Global Direct et Allianz, avant de rejoindre Diot Siaci en 2022, au titre de Responsable du Data Lab.

Points clés

À qui s’adresse cette formation ?

Aux actuaires et data scientists, informaticiens qui gèrent les bases de données, managers et directeurs responsables de la qualité des données.

Pour obtenir quoi ?

Comprendre différents types d’anomalies et de risques liés à la qualité des données ; Utiliser des techniques data science pour contrôler la qualité des données ; Apprendre comment le machine peut aider à prédire la qualité des données et comment contrôler automatiquement la qualité des données.

Quels objectifs pédagogiques ?

Analyser les problématiques de qualité de données.

Présenter les enjeux data science pour la qualité des données.

Développer des techniques avancées de correction d’anomalies.

Maîtriser les techniques prédictives et processus de correction.

Quelles méthodes mobilisées ?

Avec des études de cas et cas pratiques avec « R ».

Quels sont les prérequis ?

Aucun. Cependant la connaissance du langage de programmation R peut aider dans les cas pratiques.

Quelles modalités d’évaluation ?

Une évaluation des acquis des objectifs sera réalisée durant la formation.

 

Chaque participant se munira d’un ordinateur portable pour les travaux pratiques.

Points forts

  • Retour d’expériences sur des applications concrètes
  • Manipulation d’une base de données utilisée en assurance
Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations