TrendLabs
TrendLabs
Tunisie

Sujet-03 - Plateforme Observabilité, Incidents, Alerting et Runbooks

SRE/ObservabilityDevopsSRE/ObservabilityAIOps / ObservabilityFull-stack (Laravel/React)Monitoring/AlertingCloud/SaaSBackend (Node.js/Express)pythonLLM/IASentryCloudWatchSlack

Publié il y a environ 1 mois

Stage
⏱️4-6 mois
💼Présentiel
📅Expiré il y a 19 jours
Nom de fichier propre: prenom-nom-cv.pdf.

Description du poste

Objectif: Créer une plateforme unique pour centraliser l'observabilité (logs, métriques), corréler les alertes et automatiser la création de runbooks via l'IA pour accélérer la résolution d'incidents.

Fonctionnalités attendues:

  • Module Observabilité & Alertes: Centralisation des flux (CloudWatch, Sentry) et génération de résumés d'alertes corrélées par LLM, diffusion sur Slack/Email.
  • Module Capitalisation & Runbooks: Regroupement intelligent des incidents passés et génération automatique de brouillons de runbooks par IA pour guider les interventions futures.

Technologies: Node.js ou Python, LLM (OpenAI/Anthropic), Sentry, CloudWatch, Webhooks, Prometheus/Grafana, Slack.

Profil recherché: Full-stack / DevOps.


📧 Pour postuler: contact@trendlabs.tn