Concevoir une solution intelligente pour automatiser et optimiser la validation des fichiers RDF et faciliter la collaboration et la traçabilité entre les équipes.
Réduire les interventions manuelles tout en proposant des explications contextuelles et des corrections adaptées pour chaque anomalie détectée.
Fonctionnalités clés attendues
Automatisation du processus complet de validation (ingestion, validation, reporting, correction proposée) avec des workflows pilotés (n8n).
Détection et explication des erreurs de manière contextuelle, proposition de corrections et mécanismes d'amélioration continue basés sur l'historique des validations.
Architecture et composants techniques
Back-end en Python pour la logique de validation, pipeline ETL RDF et intégration des modèles d'IA (LangChain) pour la génération d'explications et propositions de correction.
Base de données PostgreSQL pour stocker les fichiers validés, les historiques d'actions, les métadonnées de traçabilité et les jeux d'entraînement/feedback.
Front-end en React pour une interface de visualisation des erreurs, suggestions de correction, workflow de validation et collaboration entre utilisateurs.
Orchestration des automatismes et des triggers via n8n pour piloter l'ingestion, la validation, les notifications et les workflows de correction.
Tâches et livrables attendus
Implémentation d'un pipeline d'ingestion RDF et d'un moteur de règles de validation (syntaxe, schéma, contraintes sémantiques).
Module d'explication d'erreurs et de génération de corrections proposées (intégration LangChain / LLM) avec évaluation de confiance.
Interface utilisateur React présentant les erreurs, l'historique, les propositions de correction et les outils de collaboration/assignation.
Jeu de tests, documentation technique, guide d'installation et démonstrateur fonctionnel (scénarios d'usage + métriques d'évaluation).
Critères d'évaluation
Taux de détection d'anomalies (recall) et précision des corrections proposées.
Qualité des explications (clarté, contextualisation) évaluée par tests utilisateurs et métriques internes.
Robustesse de la traçabilité (audit trail) et facilité d'intégration dans pipeline existant.
Compétences recherchées
Maîtrise de Python pour le back-end, traitement RDF et intégration d'APIs LLM (LangChain).
Expérience React pour concevoir des interfaces de diagnostic et correction.
Connaissances en bases relationnelles (PostgreSQL) et en outils d'orchestration/automation (n8n).
Intérêt pour le Web sémantique (RDF, ontologies) et pour l'IA appliquée à l'explicabilité des erreurs.
Modalités et postuler
Durée indicative : 3-6 mois, travail en mode agile et collaboration avec équipes data/produit.
Technologies principales : n8n, Python, React, PostgreSQL, LangChain.