Continuous Net - 1 Voice Ask Innovation : Orchestrateur vocal IA de nouvelle génération PFE | Hi Interns

Contexte et objectifs

Développer un système complet d'IA vocale en full-duplex (communication bidirectionnelle simultanée) avec une latence comparable aux conversations humaines naturelles.
Concevoir une architecture orchestrée « Oreille-Cerveau-Voix » intégrant plusieurs services d'IA de pointe pour capturer, comprendre, générer et synthétiser la parole en temps réel.

Capture audio haute fidélité depuis le navigateur (streaming bas débit/haute qualité selon contexte) et gestion des interruptions (barge-in) pour permettre l'interaction naturelle.
Pipeline temps réel comprenant : Speech-to-Text (transcription), LLM pour génération de réponses, Text-to-Speech (synthèse vocale) et stockage des sessions et historiques conversationnels.
Gestion des sessions, persistance des historiques et API d'orchestration des différents modules (routing, synchronisation audio/texte, reprise après interruption).

Bonne connaissance du langage JavaScript ; expérience avec React Native, Expo et TypeScript appréciée.
Maîtrise ou familiarité souhaitée avec Zustand, React Query, Zod, Victory Native et react-native-maps pour les composants front-end/mobile.
Connaissances en traitement du signal audio, protocoles de streaming audio, WebRTC/WebAudio et intégration d'APIs STT/TTS/LLM.

Latence optimisée pour conversations naturelles (full-duplex, gestion simultanée écoute/parole).
Robustesse face aux interruptions et capacité à reprendre le dialogue sans perte de contexte.
Architecture modulaire et extensible pour permettre le remplacement ou la mise à jour des modèles d'IA (STT, LLM, TTS).

Réf : VAIOVIDNG_S122026
Nombre de stagiaires : 1 (ingénieur)
Durée du stage : De 4 à 6 mois (lieu : Sousse – Khzema Technologies)
Profil recherché : étudiant en fin d'études ingénieur/MASTER avec appétence pour IA, audio temps réel et développement full-stack/mobile.