Contexte et objectif
- Thème : Gestion électronique des documents avec IA. Objectif principal : concevoir une GED cognitive capable de reconnaître, classer, résumer et traduire automatiquement les documents scannés.
- Cas d'usage : traitement de documents scannés (factures, contrats, courriers) pour extraction d'information, recherche sémantique, génération de résumés et traduction automatique.
Compétences ciblées et technologies
- Compétences techniques visées : NLP, OCR, classification, recherche sémantique et intégration full-stack.
- Technologies proposées : FastAPI (backend), React (frontend), Tesseract (OCR), LangChain et GPT-4 (gestion des prompts et génération), FAISS (indexation d'embeddings pour recherche sémantique).
Tâches proposées et livrables
- Implémenter une chaîne OCR robuste sur documents scannés (prétraitement d'images, Tesseract, nettoyage du texte) et pipeline de classification automatique des documents.
- Construire des modules de résumé et de traduction automatique en s'appuyant sur LangChain et GPT-4 ; intégrer une recherche sémantique via embeddings et FAISS.
- Développer une API (FastAPI) exposant les services (upload, OCR, classification, résumé, traduction, recherche) et un prototype frontend en React démontrant l'usage.
- Livrables attendus : code source complet (containerisé), API documentée, frontend démo, rapport technique et métriques d'évaluation (précision/F1 pour classification, ROUGE/BLEU pour résumé/traduction, latence/robustesse pour l'OCR).
Environnement et attentes
- Langages et outils : Python, JavaScript/React, Docker, tests unitaires, gestion de versions (Git). Connaissances en modèles de language, embeddings, et évaluation NLP fortement recommandées.
- Critères d'évaluation : pertinence des classifications, qualité des résumés et traductions, performance de la recherche sémantique, ergonomie du prototype et qualité du rapport.
Modalités de candidature
- Pour postuler, envoyer votre candidature par e‑mail à l'adresse : pfe2026@vaeerdia.com.
- Objet recommandé pour l'e‑mail : "Candidature PFE 2026 – SUJET 8 GED INTELLIGENTE". Inclure CV, lettre de motivation et éventuellement exemples de projets ou code.