Yuma Tunisia
Yuma Tunisia
Tunisie

5 Smart RDF Validation Platform PFE

Semantic WebWeb / Full-stack DevelopmentMachine Learning/IA

Publié il y a 20 jours

Stage
⏱️3-6 mois
💼Hybride
💰Rémunéré
📅Expiré il y a 6 jours
Cohérence LinkedIn / CV vérifiée.

Description du poste

Contexte et objectif

  • Concevoir une solution intelligente pour automatiser et optimiser la validation des fichiers RDF et faciliter la collaboration et la traçabilité entre les équipes.
  • Réduire les interventions manuelles tout en proposant des explications contextuelles et des corrections adaptées pour chaque anomalie détectée.

Fonctionnalités clés attendues

  • Automatisation du processus complet de validation (ingestion, validation, reporting, correction proposée) avec des workflows pilotés (n8n).
  • Détection et explication des erreurs de manière contextuelle, proposition de corrections et mécanismes d'amélioration continue basés sur l'historique des validations.

Architecture et composants techniques

  • Back-end en Python pour la logique de validation, pipeline ETL RDF et intégration des modèles d'IA (LangChain) pour la génération d'explications et propositions de correction.
  • Base de données PostgreSQL pour stocker les fichiers validés, les historiques d'actions, les métadonnées de traçabilité et les jeux d'entraînement/feedback.
  • Front-end en React pour une interface de visualisation des erreurs, suggestions de correction, workflow de validation et collaboration entre utilisateurs.
  • Orchestration des automatismes et des triggers via n8n pour piloter l'ingestion, la validation, les notifications et les workflows de correction.

Tâches et livrables attendus

  • Implémentation d'un pipeline d'ingestion RDF et d'un moteur de règles de validation (syntaxe, schéma, contraintes sémantiques).
  • Module d'explication d'erreurs et de génération de corrections proposées (intégration LangChain / LLM) avec évaluation de confiance.
  • Interface utilisateur React présentant les erreurs, l'historique, les propositions de correction et les outils de collaboration/assignation.
  • Jeu de tests, documentation technique, guide d'installation et démonstrateur fonctionnel (scénarios d'usage + métriques d'évaluation).

Critères d'évaluation

  • Taux de détection d'anomalies (recall) et précision des corrections proposées.
  • Qualité des explications (clarté, contextualisation) évaluée par tests utilisateurs et métriques internes.
  • Robustesse de la traçabilité (audit trail) et facilité d'intégration dans pipeline existant.

Compétences recherchées

  • Maîtrise de Python pour le back-end, traitement RDF et intégration d'APIs LLM (LangChain).
  • Expérience React pour concevoir des interfaces de diagnostic et correction.
  • Connaissances en bases relationnelles (PostgreSQL) et en outils d'orchestration/automation (n8n).
  • Intérêt pour le Web sémantique (RDF, ontologies) et pour l'IA appliquée à l'explicabilité des erreurs.

Modalités et postuler

  • Durée indicative : 3-6 mois, travail en mode agile et collaboration avec équipes data/produit.
  • Technologies principales : n8n, Python, React, PostgreSQL, LangChain.
  • Postuler en ligne via le lien suivant : https://lnkd.in/dgPWirGY