STMicroelectronics
STMicroelectronics
Tunisie

Project_ID03 AI-powered Chatbot for Customer Support Using STMicroelectronics’ Public GitHub Data PFE

Data Science & Artificial IntelligenceMachine Learning / Generative AInatural language processing

Publié il y a environ 2 heures

Stage
⏱️4-6 mois
💼Hybride
💰Rémunéré
📅Expire dans 14 jours
Épingle tes projets utiles sur GitHub.

Description du poste

Purpose / Objectives

  • Développer un chatbot IA pour le support client en utilisant les données publiques des dépôts GitHub de STMicroelectronics.
  • Améliorer l'expérience utilisateur en automatisant les réponses aux questions techniques et en réduisant le temps de réponse.

Travaux à réaliser / Tâches principales

  • Collecter et prétraiter les données publiques provenant des dépôts GitHub de STMicroelectronics (extraction, nettoyage, normalisation).
  • Définir et formater les données pour qu'elles soient compatibles avec les exigences d'entraînement des modèles d'IA (annotations, structure, tokenisation).
  • Développer et entraîner un modèle de Generative AI (GenAI) capable de comprendre et de répondre aux requêtes clients.
  • Implémenter une architecture Retrieval-Augmented Generation (RAG) pour combiner la récupération de documents pertinents et la génération afin d'améliorer la précision des réponses.
  • Tester, évaluer et affiner le chatbot pour garantir fiabilité et pertinence dans des scénarios de support client.

Approche technique / Méthodologie

  • Pipeline de données : scraping/ingestion depuis GitHub public, nettoyage, création d'embeddings, indexation dans un store vectoriel pour retrieval.
  • Modélisation : sélection et fine-tuning d'un LLM ou d'un modèle de génération adapté, engineering des prompts, définition des métriques d'évaluation (précision, pertinence, taux de réponse correcte).
  • RAG : conception du flux retrieval + génération, tests de latence et pertinence, stratégies de ranking des documents récupérés.

Livrables attendus

  • Prototype fonctionnel du chatbot IA intégrant RAG, démontrable sur cas d'usage de support technique.
  • Pipeline de prétraitement et jeu de données formaté prêt pour l'entraînement.
  • Rapport technique détaillant les choix d'architecture, les résultats d'évaluation, et les recommandations d'amélioration.
  • Documentation d'intégration et guide d'utilisation pour les équipes internes.

Contexte & Mots-clés

  • Contexte : STTunis 2026, utilisation de données publiques GitHub de STMicroelectronics.
  • Mots-clés : AI chatbot, Generative AI, Data preprocessing, Model training, Retrieval-Augmented Generation (RAG), GitHub data, Customer support automation.
STMicroelectronics - Project_ID03 AI-powered Chatbot for Customer Support Using STMicroelectronics’ Public GitHub Data PFE | Hi Interns