Contexte et objectif
- Déployer un agent RAG (Retrieval-Augmented Generation) multimodal pour la recherche et la consultation intelligente de contenus hétérogènes (texte, tableaux, images, audio/voix).
- L'agent doit ingérer et indexer des documents, extraire l'information (OCR, extraction de tableaux, transcription, traduction), retrouver les passages pertinents et générer des réponses précises et sourcées.
Missions principales
- Implémenter les pipelines d'ingestion et d'indexation pour formats variés : texte, PDF, tableaux, images, fichiers audio (transcription via Whisper ou équivalent).
- Développer les composants de recherche (vector search), récupération de passages pertinents, et génération avec LLMs (RAG) incluant attribution de sources et formats de sortie : réponses, résumés, extraction de faits.
- Concevoir un mode conversationnel supportant questions/réponses, résumé multi-document, extraction structurée de faits et historique de dialogue.
- Intégrer le système via une interface web et/ou mobile moderne et conviviale (UX/UI), avec API (FastAPI/REST) et conteneurisation (Docker) pour déploiement.
Technologies et compétences requises
- Compétences attendues : AI/GenAI, prompt engineering, LLM, RAG, OCR, parsing, transcription (Whisper), traitement de tableaux et images.
- Compétences de développement : Python, frameworks web/API (FastAPI/REST), front-end (Angular/React/Flutter), Docker, Git, bonnes pratiques CI/CD et tests.
- Niveau d'études : Bac +5 (Cycle ingénieur ou master). Autonomie, rigueur, sens du produit et capacité à travailler en mode itératif/UX.
Modalités, livrables et encadrement
- Entité d’accueil : Data et IA Factory - Systèmes d’information décisionnel. Nombre de stagiaires requis : 1. Durée du stage : 6 mois.
- Livrables attendus : prototype fonctionnel de l’agent RAG multimodal, documentation technique, procédures d’ingestion/indexation, démonstration web/mobile et rapport de stage.
- Déploiement attendu en conteneurs avec API exposée, tests de qualité des réponses et exemples d’intégration front-end.
- Pour postuler : Postuler ici.