REF: Readdly-2026-072 Trainees Voice-to-animated-story generator for educational content PFE
REF: Readdly-2026-072 Trainees Voice-to-animated-story generator for educational content PFE
ReaddlyTech•Tunisie
Machine Learning/IASpeech ProcessingFull Stack Web Development
Publié il y a 6 mois
Stage
⏱️4-6 mois
💼Hybride
📅Expiré il y a 6 mois
Reste lisible (ATS friendly).
Description du poste
Project overview
Développement d'un système d'IA qui transforme une histoire narrée (audio ou texte) en une vidéo éducative animée avec un narrateur avatar synthétique.
Cible : support d'apprentissage pour enfants (y compris dyslexiques ou apprenants auditifs) et outils pour permettre aux enseignants de convertir des leçons en contenus audiovisuels engageants.
Scope & responsabilités
Extraction de voix propre à partir d'audio bruyant (source separation) et pipeline de transcription audio vers texte (Whisper + correction de ponctuation et d'erreurs).
Génération automatique de la vidéo à partir du script (text-to-video), synthèse vocale (TTS) et pilotage d'un avatar animé pour la narration.
Développement d'une interface web : l'enseignant téléverse texte ou audio et reçoit l'histoire animée en sortie.
Technologies & outils
AI/ML : Python, PyTorch, SpeechBrain / Demucs pour séparation de source, Whisper pour STT, bibliothèques TTS et Transformers.
Génération vidéo : intégration d'APIs telles que RunwayML / Pika Labs / Stable Video Diffusion.
Profil recherché : Software Engineer (candidat.e.s débutant.e.s accepté.e.s) ; mention "18" dans l'offre (pré-requis d'âge possible : 18+).
Compétences souhaitées : traitement du signal audio, ML (PyTorch), expérience avec APIs de génération vidéo, développement fullstack basique pour intégration web.
Livrables attendus
Pipeline complet permettant : entrée audio/texte → sortie vidéo animée avec voix/ avatar synthétique.
Documentation technique, scripts de déploiement, et intégration d'une interface web minimale pour tests enseignants.