Objectif: Développer un outil d’analyse et de conversion semi-automatique de scripts SAS vers Python (pandas/scikit-learn), avec voies d’industrialisation (Dataiku).
Missions:
- Étudier les structures de scripts SAS typiques.
- Définir la logique de parsing et de traduction vers Python (pandas, sklearn).
- Développer un prototype d’outil semi-automatique et automatiser la conversion (variables, tables, boucles, macros).
- Valider sur un panel de modèles réels et documenter la méthodologie.
- Proposer des pistes d’industrialisation (Dataiku) et Git.
Profil/Exigences:
- Ingénierie en informatique/data engineering/statistiques appliquées.
- Python, parsing, SAS, data pipelines, automatisation, Git.
- Soft skills: rigueur, analyse, communication, autonomie, synthèse.
Durée: 5 mois (Fév – Juin) Nombre de stagiaires: 1