Continuous Net
Continuous Net
Tunisie

1 Voice Ask Innovation : Orchestrateur vocal IA de nouvelle génération PFE

Intelligence artificielle / AnalytiqueDéveloppement logiciel (C++, Python)Traitement du signal audio

Publié il y a environ 21 heures

Stage
⏱️4-6 mois
💼Présentiel
📅Expire dans 13 jours
Découpe: lire / adapter / envoyer. Étape 1.

Description du poste

Contexte et objectifs

  • Développer un système complet d'IA vocale en full-duplex (communication bidirectionnelle simultanée) avec une latence comparable aux conversations humaines naturelles.
  • Concevoir une architecture orchestrée « Oreille-Cerveau-Voix » intégrant plusieurs services d'IA de pointe pour capturer, comprendre, générer et synthétiser la parole en temps réel.

Fonctionnalités attendues / Livrables

  • Capture audio haute fidélité depuis le navigateur (streaming bas débit/haute qualité selon contexte) et gestion des interruptions (barge-in) pour permettre l'interaction naturelle.
  • Pipeline temps réel comprenant : Speech-to-Text (transcription), LLM pour génération de réponses, Text-to-Speech (synthèse vocale) et stockage des sessions et historiques conversationnels.
  • Gestion des sessions, persistance des historiques et API d'orchestration des différents modules (routing, synchronisation audio/texte, reprise après interruption).

Compétences techniques requises et stack

  • Bonne connaissance du langage JavaScript ; expérience avec React Native, Expo et TypeScript appréciée.
  • Maîtrise ou familiarité souhaitée avec Zustand, React Query, Zod, Victory Native et react-native-maps pour les composants front-end/mobile.
  • Connaissances en traitement du signal audio, protocoles de streaming audio, WebRTC/WebAudio et intégration d'APIs STT/TTS/LLM.

Contraintes et critères de performance

  • Latence optimisée pour conversations naturelles (full-duplex, gestion simultanée écoute/parole).
  • Robustesse face aux interruptions et capacité à reprendre le dialogue sans perte de contexte.
  • Architecture modulaire et extensible pour permettre le remplacement ou la mise à jour des modèles d'IA (STT, LLM, TTS).

Informations pratiques

  • Réf : VAIOVIDNG_S122026
  • Nombre de stagiaires : 1 (ingénieur)
  • Durée du stage : De 4 à 6 mois (lieu : Sousse – Khzema Technologies)
  • Profil recherché : étudiant en fin d'études ingénieur/MASTER avec appétence pour IA, audio temps réel et développement full-stack/mobile.