Projet (FR): Évaluer et améliorer la qualité des données clients/contrats/sinistres pour un assureur.
Responsabilités / livrables:
- Identifier les valeurs manquantes, doublons et incohérences dans les fichiers clients, contrats et sinistres.
- Calculer un score de qualité global et proposer des recommandations de nettoyage.
- Mettre en place un pipeline automatisé de Data Quality pour traiter les données de plusieurs clients de manière scalable et répétable.
- Automatisation possible avec Airflow (gestion des workflows) ou Kubeflow (orchestration et pipelines ML).
- Benchmark avec autres outils de Data Quality.
- Visualisation des résultats via un tableau de bord interactif.
Technologies (from brief): Python (Pandas, NumPy), YData-Profiling, Great Expectations, Plotly, Streamlit, Power BI, Airflow / Kubeflow.
Postuler par email:
PFE@WEVIOO.COM