Missions :
- Rassembler des jeux de données spécifiques aux documents administratifs, comprenant une diversité de formats, de polices, et de qualités d'image. Effectuer un prétraitement sur ces données pour les rendre adaptées à l'entraînement de modèles OCR.
- Examiner les modèles OCR traditionnels appliqués aux documents administratifs pour comprendre leurs performances actuelles et leurs limites.
- Concevoir et entraîner des modèles de reconnaissance optique de caractères basés sur des architectures de réseaux de neurones profonds, en mettant l'accent sur les particularités des documents administratifs.
- Mettre en œuvre des techniques d'optimisation spécifiques aux documents administratifs, tenant compte des formats spécifiques, des zones de texte, et des éléments uniques des cartes d'identité, cartes grises, et permis de conduire.
- Évaluer les performances des modèles sur des jeux de données de test représentatifs des documents administratifs. Comparer les résultats avec des modèles OCR traditionnels.
Date d’expiration: 14 février, 2024