REF: Readdly-2026-072 Trainees Voice-to-animated-story generator for educational content PFE
REF: Readdly-2026-072 Trainees Voice-to-animated-story generator for educational content PFE
ReaddlyTech•Tunisie
Machine Learning/IASpeech ProcessingFull Stack Web Development
Publié il y a 15 jours
Stage
⏱️4-6 mois
💼Hybride
📅Expiré il y a 2 jours
Cohérence LinkedIn / CV vérifiée.
Description du poste
Project overview
Développement d'un système d'IA qui transforme une histoire narrée (audio ou texte) en une vidéo éducative animée avec un narrateur avatar synthétique.
Cible : support d'apprentissage pour enfants (y compris dyslexiques ou apprenants auditifs) et outils pour permettre aux enseignants de convertir des leçons en contenus audiovisuels engageants.
Scope & responsabilités
Extraction de voix propre à partir d'audio bruyant (source separation) et pipeline de transcription audio vers texte (Whisper + correction de ponctuation et d'erreurs).
Génération automatique de la vidéo à partir du script (text-to-video), synthèse vocale (TTS) et pilotage d'un avatar animé pour la narration.
Développement d'une interface web : l'enseignant téléverse texte ou audio et reçoit l'histoire animée en sortie.
Technologies & outils
AI/ML : Python, PyTorch, SpeechBrain / Demucs pour séparation de source, Whisper pour STT, bibliothèques TTS et Transformers.
Génération vidéo : intégration d'APIs telles que RunwayML / Pika Labs / Stable Video Diffusion.
Profil recherché : Software Engineer (candidat.e.s débutant.e.s accepté.e.s) ; mention "18" dans l'offre (pré-requis d'âge possible : 18+).
Compétences souhaitées : traitement du signal audio, ML (PyTorch), expérience avec APIs de génération vidéo, développement fullstack basique pour intégration web.
Livrables attendus
Pipeline complet permettant : entrée audio/texte → sortie vidéo animée avec voix/ avatar synthétique.
Documentation technique, scripts de déploiement, et intégration d'une interface web minimale pour tests enseignants.