Objectif: Concevoir, déployer et configurer un cluster Kubernetes pour héberger des applications critiques, avec une solution de monitoring intelligent permettant la détection proactive d’anomalies et l’alerte des équipes.
Travaux demandés:
- Déploiement et configuration d’un cluster Kubernetes multi-nœuds ou local
- Mise en place de la scalabilité, résilience et tolérance aux pannes
- Installation et configuration de Prometheus, Grafana, Loki
- Définition des métriques critiques et alertes intelligentes (seuils dynamiques / détection IA/ML)
- Création de dashboards de supervision temps réel
Mots-clés & Technologies:
- Kubernetes, Prometheus, Grafana, Loki, Helm, Ansible
- Python, Scikit-learn, Observabilité, Détection d’anomalies