Projet: Mettre en place un pipeline complet de reconnaissance vocale pour le dialecte tunisien (collecte/prétraitement audio, entraînement et intégration d’un modèle ASR) et l’intégrer à un système de dialogue pour des cas d’usage en santé.
Missions principales:
- Collecter, annoter et prétraiter des données audio en dialecte tunisien
- Entraîner/affiner un modèle ASR (PyTorch/TensorFlow), évaluer WER/CER
- Intégrer le modèle ASR au système de dialogue et optimiser l’inférence
- Adapter le système aux contraintes du domaine médical
Compétences requises:
- NLP, deep learning (PyTorch ou TensorFlow)
- Connaissance des modèles de reconnaissance vocale (ASR)
- Python et gestion de données audio
- Autonomie, curiosité, travail sur dialecte peu documenté
Lieu: Présentiel au Technopôle El Ghazala (Tunis) ou au Technopole de Sousse
📧 Pour postuler:
contact@data2innov.fr