Timsoft
Timsoft
Tunisie

Retail - Sujet 3 - Système de Q&A sur documentation technique

Energy Storage / Battery ResearchNLP & SimilaritéIA générative / Machine LearningRecherche sémantiqueAI ChatbotIntelligence Artificielle (LLMs/NLP)Retrieval hybrideRe-rankingBases de données vectorielles & MLOps

Publié il y a environ 8 heures

Stage
⏱️4-6 mois
💼Présentiel
📅Expire dans environ 1 mois
Tu te rapproches. Continue.

Description du poste

Mise en place d’un système intelligent de Q&A sur une large documentation technique basé sur RAG et l’IA générative.

Missions:

  • Construire un pipeline d’indexation: ingestion PDF, chunking, embeddings et index vectoriel
  • Implémenter une chaîne RAG complète: retrieval hybride, re-ranking, génération de réponses sourcées
  • Intégrer la détection hors-sujet et un chatbot conversationnel avec historique
  • Évaluer, affiner et déployer: exactitude, latence, taux de refus corrects

Objectifs mesurables:

  • ≥75% d’exactitude des réponses (jeu de test annoté)
  • 95% des réponses citent leurs sources
  • Latence ≤10 secondes
  • Couverture du corpus ≥90%
  • Interface utilisateur fonctionnelle (chat web ou CLI)

Technologies/Outils:

  • NLP/Orchestration: Hugging Face, Sentence-Transformers, LangChain/LlamaIndex
  • Index/DB: Milvus, Weaviate, Azure AI Search, Pinecone
  • Ingestion: PyMuPDF, pdfplumber, Unstructured, Playwright/Selenium
  • Backend: FastAPI, Redis, Pydantic
  • Frontend: Vue.js/React, Streamlit (optionnel)
  • LLM: OpenAI GPT-4/Azure OpenAI, Mistral, Llama 2; prompts Jinja2
  • MLOps/Évaluation: MLflow, Ragas/TruLens, W&B, N8N; Git/GitHub
  • Infra: Docker, Python, Jupyter

Mots-clés: RAG, Semantic Search, Fine-tuning, Generative AI, Chatbot

Timsoft - Retail - Sujet 3 - Système de Q&A sur documentation technique | Hi Interns | Hi Interns