Projet PFE visant à concevoir un système intelligent capable d’analyser des photos/scans de menus de restaurants et de les convertir en données structurées (plats, prix, options/add-ons). Le système doit aussi générer une image représentative pour chaque item via un modèle d’IA de génération d’images.
Objectifs principaux:
- Extraction automatique des items de menu, prix, options et variantes à partir d’images hétérogènes (layouts, polices, langues, qualité variable)
- Utilisation de l’OCR et du NLP pour détecter, segmenter et normaliser les informations
- Génération d’une image représentative par item via un modèle d’IA de génération d’images
- Maximiser la robustesse, l’adaptabilité et la précision
Tâches possibles:
- Prétraitement des images et OCR (segmentation, débruitage, layout analysis)
- NLP pour la structuration: parsing, extraction d’entités (plats, prix, options), normalisation
- Conception du pipeline bout‑en‑bout et évaluation (métriques d’extraction, qualité des images générées)
- Intégration d’un modèle de génération d’images et réglage des prompts
- Packaging (API/service) et démonstrateur
Nombre de stagiaires: 1 ou 2 Durée: 4 à 6 mois
📧 Pour postuler:
contact@tocodepro.com