1 Voice Ask Innovation : Orchestrateur vocal IA de nouvelle génération PFE
1 Voice Ask Innovation : Orchestrateur vocal IA de nouvelle génération PFE
Continuous Net•Tunisie
Intelligence artificielle / AnalytiqueDéveloppement logiciel (C++, Python)Traitement du signal audio
Publié il y a environ 21 heures
Stage
⏱️4-6 mois
💼Présentiel
📅Expire dans 13 jours
Découpe: lire / adapter / envoyer. Étape 1.
Description du poste
Contexte et objectifs
Développer un système complet d'IA vocale en full-duplex (communication bidirectionnelle simultanée) avec une latence comparable aux conversations humaines naturelles.
Concevoir une architecture orchestrée « Oreille-Cerveau-Voix » intégrant plusieurs services d'IA de pointe pour capturer, comprendre, générer et synthétiser la parole en temps réel.
Fonctionnalités attendues / Livrables
Capture audio haute fidélité depuis le navigateur (streaming bas débit/haute qualité selon contexte) et gestion des interruptions (barge-in) pour permettre l'interaction naturelle.
Pipeline temps réel comprenant : Speech-to-Text (transcription), LLM pour génération de réponses, Text-to-Speech (synthèse vocale) et stockage des sessions et historiques conversationnels.
Gestion des sessions, persistance des historiques et API d'orchestration des différents modules (routing, synchronisation audio/texte, reprise après interruption).
Compétences techniques requises et stack
Bonne connaissance du langage JavaScript ; expérience avec React Native, Expo et TypeScript appréciée.
Maîtrise ou familiarité souhaitée avec Zustand, React Query, Zod, Victory Native et react-native-maps pour les composants front-end/mobile.
Connaissances en traitement du signal audio, protocoles de streaming audio, WebRTC/WebAudio et intégration d'APIs STT/TTS/LLM.
Contraintes et critères de performance
Latence optimisée pour conversations naturelles (full-duplex, gestion simultanée écoute/parole).
Robustesse face aux interruptions et capacité à reprendre le dialogue sans perte de contexte.
Architecture modulaire et extensible pour permettre le remplacement ou la mise à jour des modèles d'IA (STT, LLM, TTS).
Informations pratiques
Réf : VAIOVIDNG_S122026
Nombre de stagiaires : 1 (ingénieur)
Durée du stage : De 4 à 6 mois (lieu : Sousse – Khzema Technologies)
Profil recherché : étudiant en fin d'études ingénieur/MASTER avec appétence pour IA, audio temps réel et développement full-stack/mobile.