Vous rejoignez une équipe qui construit et opère des flux de données industriels alimentant des applications métiers pour le secteur public, en particulier les collectivités et territoires. Ci-après des exemples concrets dans la Smart-City:
- Optimisation des consommations énergétiques des bâtiments à l’échelle du territoire.
- Récupération des données des capteurs IoT pour fournir des services de propreté urbaine.
- Construction de jeux de données permettant de réaliser des études démographiques.
Selon les projets, vous pourrez contribuer ponctuellement à l’industrialisation de briques IA (NLP/LLM notamment), mais ce n’est pas le cœur du rôle.
La diversité de nos clients et de leurs besoins implique des projets très variés : nouvelles sources, contraintes et patterns d’intégration.
Ce qu’on fait au quotidien dans ce rôle comprend les éléments suivants:
- Ateliers avec les clients/équipes métier pour vérifier qu’on dispose des bonnes données, au bon niveau de qualité, pour répondre au besoin.
- Récupération de données transverses depuis des sources variées (dont IoT).
- Standardisation et structuration orientées “produit” en coordination avec les équipes dev.
- Mise en place de règles de qualité, de monitoring et d’alerting sur les flux ETL.
- Investigation d’incidents (volume, latence, ruptures de qualité), durcissement des pipelines.
Le stack et l’environnement utilisés comprennent:
- ETL / orchestration : Flyte
- Backend / services : Python, FastAPI
- Déploiement : Docker, Kubernetes (clusters on-prem managés)
- Observabilité : Prometheus, Grafana
- CI/CD : GitLab CI
- Standards (selon projets IoT) : FIWARE / NGSI-LD
- Packaging Python : librairies internes réutilisables (wrappers, modèles, utilitaires)