Quantylix logo

Développement d’un outil basé sur l'apprentissage automatique

Quantylix

Tunis2 MoisSur place

Description du stage:

Contexte L'objectif est de simplifier le processus de conversion manuelle en automatisant cette tâche laborieuse par le développement d’un outil qui permet de transformer un document PDF en fichier modifiable.

Responsabilités du stagiaire Collecte et préparation des données : Le stagiaire sera responsable de la collecte d'un ensemble de données pertinentes comprenant des fichiers PDF de différentes structures et contenus. Il devra également nettoyer et prétraiter ces données en vue de l'entraînement du modèle.

  • Conception et entraînement du modèle : Le stagiaire devra concevoir un modèle d'apprentissage automatique adapté à la tâche de conversion des fichiers PDF en texte et en forme tabulaire. Il devra ensuite entraîner le modèle en utilisant les données collectées, en ajustant les hyperparamètres et en effectuant des itérations pour améliorer les performances du modèle.
  • Évaluation et amélioration du modèle : Le stagiaire sera chargé d'évaluer les performances du modèle. Il devra également analyser les erreurs et les lacunes du modèle et proposer des améliorations pour optimiser sa précision et sa robustesse.
  • Transformation des données en texte et en forme tabulaire : Une fois le modèle développéet validé, le stagiaire travaillera sur la transformation des données extraites des fichiers PDF en texte et en forme tabulaire.
  • Il devra mettre en place des méthodes et des techniques appropriées pour représenter les données de manière structurée. Il devra concevoir et implémenter les mécanismes nécessaires pour représenter les données sous forme de tableaux dans les fichiers Excel générés.
  • Tests et débogage : Le stagiaire sera responsable de la réalisation de tests rigoureux pour vérifier le bon fonctionnement de l'outil dans différents scénarios.
  • Il devra également identifier et résoudre les problèmes et les bugs éventuels afin d'assurer la qualité et la fiabilité de l'outil.

Profil recherché:

  • Issue d’une école d’ingénieurs
  • Maîtrise R/ Python
  • Connaissances en machine learning, en particulier dans les domaines de la classification et de la reconnaissance de motifs.
  • Expérience en programmation, de préférence avec des langages tels que Python.
  • Familiarité avec les bibliothèques et les outils de machine learning couramment utilisés, tels que TensorFlow, Keras ou scikit-learn
  • Capacité à travailler de manière autonome et à résoudre les problèmes de manière créative

Opportunités similaires

Plus d'offres