SUJET 5: WHUB 005 TECH TEAM Mettre en place les pipelines de données Wellness Hub et assurer une gouvernance complète des données employés (sécurité + qualité). DataOpsEngineer – Data Pipeline & Security PFE
SUJET 5: WHUB 005 TECH TEAM Mettre en place les pipelines de données Wellness Hub et assurer une gouvernance complète des données employés (sécurité + qualité). DataOpsEngineer – Data Pipeline & Security PFE
Wellness Hub•Tunisie
AI & Data EngineeringSécurité des donnéesdataops
Publié il y a 3 jours
Stage
⏱️4-6 mois
💼Hybride
💰Rémunéré
📅Expire dans 10 jours
Tu construis un pipeline, pas un coup de chance.
Description du poste
Contexte
Projet au sein de l'équipe TECH de Wellness Hub visant à concevoir et déployer les pipelines de données pour les données employés.
Objectifs centraux : automatisation des flux, sécurité des données et gouvernance (qualité, traçabilité, conformité).
Missions principales
Mettre en place des pipelines ETL/ELT robustes et réutilisables pour les données RH/employés (ingestion, traitement, stockage).
Assurer la gouvernance complète des données : politique de sécurité, qualité des données, monitoring et observabilité.
Implémenter des tests de qualité et des validations de données (ex. Great Expectations) et des alertes en cas d'anomalies.
Profil recherché & attentes pédagogiques
Étudiant(e) en diplôme d'Ingénieur Informatique (PFE) souhaitant se spécialiser en DataOps / Data Engineering / Data Security.
Autonomie, rigueur autour de la qualité des données, bonnes pratiques DevOps/DataOps et sensibilité à la sécurité des données personnelles.
Compétences techniques requises
Maîtrise de Python pour le développement des pipelines.
Expérience ou intérêt pour Airflow / Dagster pour l'orchestration des workflows.
Connaissances en Kafka pour l'ingestion temps réel, PostgreSQL pour le stockage, et Docker pour la containerisation.
Mise en place des tests de qualité des données avec Great Expectations et intégration continue/déploiement.
Livrables attendus
Pipelines de données documentés et automatisés, playbooks de gouvernance et politiques de sécurité des données employés.
Tableau de bord de monitoring et alerting pour la qualité et la sécurité des données.
Documentation technique et guide de déploiement pour l'équipe opérationnelle.