Alternance de 2 ans - démarrage septembre 2026. Deux ans, c’est suffisant pour faire plus que contribuer : tu prendras la main sur des sujets de bout en bout, avec une vraie responsabilité sur la qualité et la performance de nos pipelines IA en production. Intégré(e) à notre équipe d’AI engineers, tu contribueras à développer des applications d’IA performantes dans un contexte où la précision est critique (conformité, cybersécurité, grands comptes).
Ce que tu feras au quotidien :
- Pipelines RAG & orchestration IA
- RAG : concevoir et améliorer des pipelines de Retrieval-Augmented Generation (ingestion documentaire, chunking, embedding, retrieval, génération)
- Orchestration : workflows IA agentiques (chaînage, gestion d’état, routing conditionnel, fallbacks)
- Routage LLM : gestion multi-providers (routage, fallbacks, suivi des coûts et latences)
- APIs : développement d’endpoints pour exposer les services IA
- Évaluation, qualité & observabilité (ownership attendu sur 2 ans)
- Frameworks d’évaluation : mise en place et industrialisation d’un framework de mesure de qualité - fidélité, pertinence, précision du contexte, robustesse
- Observabilité : implémentation de traces sur les appels IA (latence, coûts, tokens, debugging), dashboards de suivi qualité
- Benchmarks : évaluation comparative de modèles, de stratégies de prompting, d’architectures RAG
- Hallucinations : contribution aux stratégies de mitigation dans un contexte où la précision est non négociable
- Régressions : construction de suites de tests automatisés pour détecter les dérives de qualité au fil des releases
- Optimisation & industrialisation
- Optimisation : analyser et réduire la consommation de tokens et les coûts d’inférence
- Documentation : documenter les choix techniques et résultats d’expérimentations
- Sécurité : bonnes pratiques pour protéger les pipelines et données sensibles
Sur 2 ans, tu auras l’opportunité de prendre la responsabilité complète d’un pan du système (typiquement l’évaluation qualité et l’observabilité IA) : définir la stratégie, l’implémenter, la faire vivre, et en être le/la référent(e) technique au sein de l’équipe.
Environnement technique Python, LLMs open source, architectures RAG, orchestration d’agents, vector stores, graph databases, infrastructure cloud souveraine (EU). Stack moderne, en constante évolution.