Contexte
Koesio avait besoin d'un outil de supervision pour surveiller en temps réel l'état des équipements réseau de plusieurs clients. L'objectif était de détecter rapidement les pannes, les surcharges ou les indisponibilités afin de réduire les temps d'intervention.
J'ai été chargé d'installer, configurer et mettre en production Zabbix sur un serveur Linux dédié, puis d'intégrer les équipements à surveiller.
Déroulement
Installation de Zabbix Server
Installation de Zabbix 6.0 LTS sur une VM Debian 11. Déploiement de la stack : Zabbix Server, Zabbix Frontend (Apache + PHP), base de données MariaDB.
Configuration SNMP sur les équipements
Activation du protocole SNMP sur les switchs et routeurs Cisco à superviser. Configuration des community strings et des MIBs nécessaires à la remontée d'informations.
Ajout des hôtes et templates
Intégration des équipements dans Zabbix en tant qu'hôtes. Application des templates Zabbix officiels pour Cisco IOS et Windows Server. Configuration des items de supervision : charge CPU, utilisation mémoire, état des interfaces réseau.
Création des triggers et alertes
Définition des seuils d'alerte (ex : CPU > 80% pendant 5 min = alerte critique). Configuration des alertes par email vers l'équipe technique Koesio.
Création de dashboards
Mise en place de tableaux de bord personnalisés pour visualiser rapidement l'état global de l'infrastructure supervisée.
Difficultés rencontrées
La configuration SNMP a nécessité plusieurs ajustements : certains équipements ne remontaient pas toutes les informations attendues car les MIBs n'étaient pas toutes installées sur le serveur Zabbix. J'ai dû les importer manuellement et vérifier la compatibilité avec chaque équipement.
J'ai également eu un problème de pare-feu bloquant les requêtes SNMP (port UDP 161). La création d'une règle spécifique sur le firewall a résolu ce point.
Résultats
La solution de supervision est opérationnelle et surveille en temps réel une dizaine d'équipements réseau. Les alertes fonctionnent correctement et permettent à l'équipe de réagir rapidement en cas d'incident. La visibilité sur l'infrastructure est nettement améliorée.