LIASENSMA
France

Extraction semi-automatique d’annotations sémantiques pour la préservation du patrimoine culturel : Intégration et exploitation de thésaurus spécialisés

Artificial Intelligence & Automation (AI/RPA)Cultural Heritage / StorytellingDatabase Engineering / Data Management

Publié il y a environ 1 mois

Stage
⏱️4-6 mois
💼Hybride
💰Rémunéré
📅Expiré il y a 26 jours
Pas motivé ? 5 minutes chrono, puis stop si tu veux.

Description du poste

Site web: http://www.lias-lab.fr

Le Laboratoire d'Informatique et d'Automatique pour les Systèmes (LIAS) est un laboratoire de recherche affilié à l’Université de Poitiers et à l’ISAE-ENSMA. Ses travaux, ancrés dans les fondements théoriques des mathématiques, de la théorie du signal, de l’informatique théorique et du génie électrique, se positionnent à la frontière des sciences et technologies de l’information et de la communication (STIC) et des sciences pour l’ingénieur (SPI). Le LIAS, composé de trois équipes aux expertises complémentaires, mobilise son savoir-faire pour aborder un large spectre d’applications allant de la gestion de l’énergie au traitement des eaux, en passant par la modélisation informatique des systèmes complexes, la gestion des données et l’aide à la décision, la conception modulaire des systèmes embarqués et les dynamiques de population d’oiseaux. Le laboratoire se distingue par sa capacité à combiner des approches académiques pointues avec des applications concrètes pour relever les défis de demain.

Le LIAS compte 39 enseignants-chercheurs, dont 50 % détiennent une habilitation à diriger des recherches (HDR), répartis entre les sections 27, 61 et 63 du Conseil National des Universités. En outre, le laboratoire bénéficie du soutien d’un ingénieur de recherche en informatique, d’un ingénieur d’études en électronique, d’un technicien en informatique et de deux adjointes en gestion administrative. Ces professionnels contribuent à la vitalité et au bon fonctionnement du laboratoire, permettant ainsi de mener à bien nos projets de recherche interdisciplinaires. Le LIAS est également constitué d’une vingtaine de doctorants qui participent activement à nos travaux.

Le patrimoine est l’objet d’une étude reposant sur des données hétérogènes issues de sources multiples (mesures, croquis, photographies, acquisitions 3D, etc.), souvent difficiles à manipuler en raison de la fragilité ou de l’inaccessibilité des objets. Le projet ANR DIGITALIS vise à développer des outils numériques dédiés à la gestion, à la pérennisation, à la réutilisation et à la visualisation de ces données. Le LIAS, partenaire du projet, conçoit des méthodes et des structures pour gérer des données complexes de manière interopérable. Dans le cadre du projet, cette expertise est mobilisée pour proposer un modèle de données dédié au patrimoine, permettant aux experts de partager et d’enrichir leurs annotations sur des objets patrimoniaux. Ce besoin s’inscrit dans la continuité des travaux existants, notamment le modèle sémantique CIDOC CRM, qui vise à assurer la traçabilité et l’annotation des objets numériques dans le domaine historique. Le principal enjeu est d’automatiser l’extraction des données vers ce modèle, une tâche complexe et chronophage, d’autant plus que les historiens maîtrisent peu ce formalisme et que les informaticiens ne sont pas spécialistes du patrimoine. Le LIAS a obtenu des résultats en explorant l’usage de l’IA générative pour transformer des données textuelles issues de fouilles archéologiques en représentations conformes au CIDOC CRM.

Objectifs

  • Premier objectif: évaluer les compromis entre précision, performance et impact environnemental, ainsi que les enjeux de vie privée liés aux déploiements cloud ou locaux. Le stagiaire reprendra les résultats existants et les évaluera sur différents modèles d’IA générative, qu’ils soient hébergés dans le cloud ou exécutés localement via des modèles à poids ouverts de petite taille, afin de se familiariser avec les concepts de base de l’IA générative et les travaux du LIAS dans ce domaine.
  • Deuxième objectif: référencer les sources (mesures, croquis, photographies, acquisitions 3D, etc.) utilisées pour produire les annotations, afin d’assurer leur traçabilité. Le stagiaire explorera des solutions permettant d’intégrer explicitement la notion de source dans le processus de génération des annotations, et se familiarisera avec le modèle CIDOC CRM.
  • Troisième objectif: intégrer des vocabulaires contrôlés, tels que des thésaurus, dans le processus de génération des annotations afin d’améliorer la cohérence et la qualité des annotations, notamment en facilitant la gestion des synonymes (par exemple: église ⇔ lieu de culte). Ce stage sera encadré par un doctorant travaillant sur des problématiques similaires et par deux chercheurs du LIAS spécialisés en IA générative et patrimoine. Une publication scientifique est attendue en fonction des résultats.

À noter que le LIAS proposera l’an prochain un financement de thèse dans le domaine de la gestion des données. Le stage constituera une excellente opportunité de découvrir le laboratoire et son environnement de recherche. Le stagiaire pourra candidater à ce financement, et sa candidature fera l’objet d’une attention particulière.

Profil

  • Le candidat doit être en Master 2 ou en dernière année de préparation d’un diplôme d’ingénieur, spécialité Informatique, et posséder des connaissances en développement logiciel et manipulation de modèles d’IA générative. Un bon niveau en français et en anglais est nécessaire.

Prise de fonction

  • 02/03/2026