Data Science appliquée à la qualité des données et aux données géographiques

Cette formation donne 84 points PPC aux membres qualifiés de l’Institut des Actuaires
Dernière mise à jour en novembre 2022

Programme de la formation

Objectifs et enjeux de la qualité des données

  • Types d’anomalies
  • Types de risques et d’impacts financiers

Bonnes pratiques et organisation des données

  • Types de fichiers et de données
  • Organisation des fichiers et des données.

Principes de traitements d’anomalies

  • Explorer les données pour détecter les valeurs aberrantes
  • Traiter les anomalies des variables numériques, des variables catégoriques, des variables textuelles.
  • Calculer un score de vraisemblance

Techniques de data science mises en œuvre

  • Webscrapping, text-mining, Machine learning, séries temporelles.
  • Clustering pour détecter des valeurs aberrantes
  • Méthodes de classifications pour calculer un score de qualité

Cas d’application

  • Vérification textuelle
  • Incohérence de catégories
  • Règles de calculs déterministes
  • Règles multi-critères
  • Segmentation des indicateurs multiples

Manipulation de données géographiques

  • Sources des données géographiques, format des données
  • Cartes thématiques, cartes avec fonds divers, cartes interactives
  • Segmentation des données et zoniers
  • Utilisation dans la classification et la régression

Construction d’un géocoedur

  • Principe de géocodage
  • Programme d’un géocodeur
  • Déploiement de la solution

Étude de cas

  • Étude de densité et de concentration
  • Zones inondables et assurés sinistrés
  • Géolocalisation des accidents automobiles
Dernière date
20 et 21 novembre 2023
Inscription possible jusqu'à la veille de la formation 16h (hors weekend et jour férié)
Horaires

9h00 - 12h30 et 14h00 - 17h30

Prix
  • 2300 € HT
  • TVA 20%
  • 2760 € TTC
Lieu

CARITAT, 24 rue Tronchet 75008 PARIS

Durée

2 jours

Programme adaptable,
sur-mesure

Notre formateur

Kezhan SHI

Il est diplômé de l'École Centrale Paris et titulaire d'un master en actuariat de l'Université Paris Dauphine. Il a travaillé chez Axa Global Direct et Allianz, avant de rejoindre Diot Siaci en 2022, au titre de Responsable du Data Lab.

Points clés

À qui s’adresse cette formation ?

Aux actuaires et data scientistes, informaticiens qui gèrent les bases de données, responsables de la qualité des données.

Pour obtenir quoi ?

Comprendre différents types d’anomalies et de risques liés à la qualité des données ;

Utiliser des techniques data science pour contrôler la qualité des données ;

Comment contrôler automatiquement la qualité des données ;

Analyser les besoins d’un géocodeur et présenter les données externes pour enrichir les données internes.

Quels objectifs pédagogiques ?

Analyser la qualité des données.

Développer des techniques avancées de correction d’anomalies.

Maîtriser et intégrer les données géographiques externes.

Quelles méthodes mobilisées ?

Par des études de cas et cas pratiques avec « R ».

Quels sont les prérequis ?

La connaissance du langage de programmation « R » .

Quelles modalités d’évaluation ?

Une évaluation des acquis des objectifs sera réalisée durant la formation.

Inscrivez-vous à notre newsletter

Pour recevoir toutes les dernières informations