TrendLabs
TrendLabs
Tunisie

Sujet-03 - Plateforme Observabilité, Incidents, Alerting et Runbooks

SRE/ObservabilityDevopsSRE/ObservabilityAIOps / ObservabilityFull-stack (Laravel/React)Monitoring/AlertingCloud/SaaSBackend (Node.js/Express)pythonLLM/IASentryCloudWatchSlack

Publié il y a 12 jours

Stage
⏱️4-6 mois
💼Présentiel
📅Expire dans 2 jours
Pas motivé ? 5 minutes chrono, puis stop si tu veux.

Description du poste

Objectif: Créer une plateforme unique pour centraliser l'observabilité (logs, métriques), corréler les alertes et automatiser la création de runbooks via l'IA pour accélérer la résolution d'incidents.

Fonctionnalités attendues:

  • Module Observabilité & Alertes: Centralisation des flux (CloudWatch, Sentry) et génération de résumés d'alertes corrélées par LLM, diffusion sur Slack/Email.
  • Module Capitalisation & Runbooks: Regroupement intelligent des incidents passés et génération automatique de brouillons de runbooks par IA pour guider les interventions futures.

Technologies: Node.js ou Python, LLM (OpenAI/Anthropic), Sentry, CloudWatch, Webhooks, Prometheus/Grafana, Slack.

Profil recherché: Full-stack / DevOps.


📧 Pour postuler: contact@trendlabs.tn