Data2Innov

Tunisie

NLP - Développement d’un système Speech-to-Text pour le dialecte tunisien arabe dans un système de dialogue

NLP - Développement d’un système Speech-to-Text pour le dialecte tunisien arabe dans un système de dialogue

Data2Innov•Tunisie

NLP & SimilaritéSpeech RecognitionASRIntelligence Artificielle / Deep LearningAI / Machine Learning (scikit-learn, PyTorch)TensorFlowAudio ProcessingHealthcare / Medical StaffingDialogue SystemsPython ML

Publié il y a 5 mois

Stage

⏱️4-6 mois

💼Présentiel

📅Expiré il y a 5 mois

Visa: commence par la liste des documents.

Description du poste

Projet: Mettre en place un pipeline complet de reconnaissance vocale pour le dialecte tunisien (collecte/prétraitement audio, entraînement et intégration d’un modèle ASR) et l’intégrer à un système de dialogue pour des cas d’usage en santé.

Missions principales:

Collecter, annoter et prétraiter des données audio en dialecte tunisien
Entraîner/affiner un modèle ASR (PyTorch/TensorFlow), évaluer WER/CER
Intégrer le modèle ASR au système de dialogue et optimiser l’inférence
Adapter le système aux contraintes du domaine médical

Compétences requises:

NLP, deep learning (PyTorch ou TensorFlow)
Connaissance des modèles de reconnaissance vocale (ASR)
Python et gestion de données audio
Autonomie, curiosité, travail sur dialecte peu documenté

Lieu: Présentiel au Technopôle El Ghazala (Tunis) ou au Technopole de Sousse

📧 Pour postuler: contact@data2innov.fr