Data2Innov
Data2Innov
Tunisie

NLP - Développement d’un système Speech-to-Text pour le dialecte tunisien arabe dans un système de dialogue

NLP & SimilaritéSpeech RecognitionASRIntelligence Artificielle / Deep LearningAI / Machine Learning (scikit-learn, PyTorch)TensorFlowAudio ProcessingHealthcare / Medical StaffingDialogue SystemsPython ML

Publié il y a environ 18 heures

Stage
⏱️4-6 mois
💼Présentiel
📅Expire dans 13 jours
Épingle tes projets utiles sur GitHub.

Description du poste

Projet: Mettre en place un pipeline complet de reconnaissance vocale pour le dialecte tunisien (collecte/prétraitement audio, entraînement et intégration d’un modèle ASR) et l’intégrer à un système de dialogue pour des cas d’usage en santé.

Missions principales:

  • Collecter, annoter et prétraiter des données audio en dialecte tunisien
  • Entraîner/affiner un modèle ASR (PyTorch/TensorFlow), évaluer WER/CER
  • Intégrer le modèle ASR au système de dialogue et optimiser l’inférence
  • Adapter le système aux contraintes du domaine médical

Compétences requises:

  • NLP, deep learning (PyTorch ou TensorFlow)
  • Connaissance des modèles de reconnaissance vocale (ASR)
  • Python et gestion de données audio
  • Autonomie, curiosité, travail sur dialecte peu documenté

Lieu: Présentiel au Technopôle El Ghazala (Tunis) ou au Technopole de Sousse


📧 Pour postuler: contact@data2innov.fr