Contexte et objectifs :
- Développer un module intelligent pour automatiser la première étape de traitement des dossiers sinistres à partir des documents fournis par l’assuré.
- Objectif chiffré : réduire de 50 % le temps de traitement manuel en extrayant les informations clés, en validant la cohérence des documents, en détectant les doublons et en pré-remplissant le dossier dans l’outil interne.
Responsabilités et livrables :
- Concevoir et implémenter un pipeline d’analyse documentaire combinant OCR et NLP pour l’extraction d’informations (dates, montants, références, pièces justificatives, etc.).
- Mettre en place des algorithmes de détection de similarité (doublons) via embeddings et similarité vectorielle, et développer le pré-remplissage automatique des formulaires dans l’outil interne.
Compétences techniques et outils :
- Technologies recommandées : Python, FastAPI pour l’API, PostgreSQL pour le stockage, Tesseract / EasyOCR pour la reconnaissance de texte, CamemBERT et Sentence Transformers pour l’encodage sémantique.
- Méthodes : OCR, NLP, embeddings, similarité vectorielle, validation de cohérence documentaire et intégration API.
Contraintes et intégration :
- Le module doit s’intégrer aux systèmes existants selon le périmètre fonctionnel défini par l’entreprise (interopérabilité, API et format de données attendus).
- Test de performance et mesures d’efficacité attendus (taux de réduction du temps de traitement, précision d’extraction, taux de faux positifs/negatifs pour la détection de doublons).
Informations pratiques :
- Type du diplôme exigé : Ingénierie en informatique.
- Nombre de stagiaire : 1. Siège COMAR : Avenue Habib Bourguiba, Tunis. Durée : 6 mois.
📧 Pour postuler:
recrutement@comar.tn