Project_ID03 AI-powered Chatbot for Customer Support Using STMicroelectronics’ Public GitHub Data PFE
Project_ID03 AI-powered Chatbot for Customer Support Using STMicroelectronics’ Public GitHub Data PFE
STMicroelectronics•Tunisie
Data Science & Artificial IntelligenceMachine Learning / Generative AInatural language processing
Publié il y a environ 2 heures
Stage
⏱️4-6 mois
💼Hybride
💰Rémunéré
📅Expire dans 14 jours
Épingle tes projets utiles sur GitHub.
Description du poste
Purpose / Objectives
Développer un chatbot IA pour le support client en utilisant les données publiques des dépôts GitHub de STMicroelectronics.
Améliorer l'expérience utilisateur en automatisant les réponses aux questions techniques et en réduisant le temps de réponse.
Travaux à réaliser / Tâches principales
Collecter et prétraiter les données publiques provenant des dépôts GitHub de STMicroelectronics (extraction, nettoyage, normalisation).
Définir et formater les données pour qu'elles soient compatibles avec les exigences d'entraînement des modèles d'IA (annotations, structure, tokenisation).
Développer et entraîner un modèle de Generative AI (GenAI) capable de comprendre et de répondre aux requêtes clients.
Implémenter une architecture Retrieval-Augmented Generation (RAG) pour combiner la récupération de documents pertinents et la génération afin d'améliorer la précision des réponses.
Tester, évaluer et affiner le chatbot pour garantir fiabilité et pertinence dans des scénarios de support client.
Approche technique / Méthodologie
Pipeline de données : scraping/ingestion depuis GitHub public, nettoyage, création d'embeddings, indexation dans un store vectoriel pour retrieval.
Modélisation : sélection et fine-tuning d'un LLM ou d'un modèle de génération adapté, engineering des prompts, définition des métriques d'évaluation (précision, pertinence, taux de réponse correcte).
RAG : conception du flux retrieval + génération, tests de latence et pertinence, stratégies de ranking des documents récupérés.
Livrables attendus
Prototype fonctionnel du chatbot IA intégrant RAG, démontrable sur cas d'usage de support technique.
Pipeline de prétraitement et jeu de données formaté prêt pour l'entraînement.
Rapport technique détaillant les choix d'architecture, les résultats d'évaluation, et les recommandations d'amélioration.
Documentation d'intégration et guide d'utilisation pour les équipes internes.
Contexte & Mots-clés
Contexte : STTunis 2026, utilisation de données publiques GitHub de STMicroelectronics.
Mots-clés : AI chatbot, Generative AI, Data preprocessing, Model training, Retrieval-Augmented Generation (RAG), GitHub data, Customer support automation.