Hébergeur Cloud depuis 2024

Retour aux articles
Maintenance 8 min de lecture

Checkmk : la supervision informatique taillée pour les PME

VaultAura Team

21 février 2026

Checkmk : la supervision informatique taillée pour les PME

Découvrez Checkmk, l'outil de monitoring IT open source idéal pour surveiller l'infrastructure de votre PME. Guide complet : installation, configuration et bonnes pratiques.

Pourquoi la supervision informatique est vitale pour votre PME

Dans une PME, chaque minute d'indisponibilité coûte cher. Un serveur qui tombe en panne un vendredi soir, une connexion Internet saturée pendant une visioconférence client, un disque dur qui atteint silencieusement 95 % de capacité… Ces incidents surviennent souvent sans prévenir. Et quand on les découvre, il est déjà trop tard.

La supervision informatique — ou monitoring IT — consiste à surveiller en temps réel l'état de vos équipements, services et réseaux. L'objectif : détecter les anomalies avant qu'elles ne deviennent des pannes. Pour les PME qui n'ont pas de DSI en interne, c'est un filet de sécurité indispensable.

Parmi les solutions disponibles, Checkmk se distingue par sa simplicité de déploiement, sa puissance et son modèle open source. Voyons pourquoi cet outil mérite votre attention.

Checkmk : présentation et positionnement

Qu'est-ce que Checkmk ?

Checkmk est une plateforme de supervision IT développée par la société allemande Checkmk GmbH (anciennement tribe29). Née en 2008 comme extension de Nagios, elle a depuis évolué en solution autonome et complète.

L'outil permet de surveiller :

  • Les serveurs (Linux, Windows, macOS) : CPU, RAM, disques, processus
  • Les équipements réseau : switches, routeurs, bornes Wi-Fi, firewalls
  • Les services applicatifs : bases de données, serveurs web, files de messagerie
  • Les environnements cloud : AWS, Azure, conteneurs Docker
  • Les équipements physiques : onduleurs, capteurs de température, imprimantes

Pourquoi Checkmk plutôt qu'un autre outil ?

Le marché du monitoring est vaste : Zabbix, Nagios, Prometheus+Grafana, PRTG… Checkmk se démarque sur plusieurs points :

  • Découverte automatique : Checkmk détecte automatiquement les services à surveiller sur chaque machine. Pas besoin de configurer manuellement des centaines de checks.
  • Interface web intuitive : Tableaux de bord clairs, vues filtrées, graphiques intégrés. Même un non-technicien peut comprendre l'état du parc.
  • Scalabilité : De 10 à 10 000 hôtes sans changer d'architecture.
  • Performance : Le micro-core CMC (disponible dans l'édition commerciale) gère des milliers de checks par seconde avec une empreinte mémoire minimale.
  • Édition gratuite complète : La Raw Edition (open source, basée sur Nagios core) couvre largement les besoins d'une PME de 10 à 200 postes.

Les éditions de Checkmk : laquelle choisir ?

Raw Edition (gratuite, open source)

C'est l'édition de référence pour les PME. Elle inclut :

  • Monitoring complet (agents, SNMP, checks actifs)
  • Interface web WATO pour la configuration
  • Alerting par email, SMS, Slack, Teams
  • Graphiques de performance (PNP4Nagios intégré)
  • API REST pour l'automatisation

Limitations : pas de micro-core CMC (utilise Nagios core), pas de monitoring synthétique, pas de reporting avancé.

Cloud Edition et Enterprise Edition

Pour les structures plus grandes ou les MSP (Managed Service Providers), ces éditions ajoutent le CMC haute performance, le monitoring distribué, le reporting PDF, et le support professionnel. Les tarifs démarrent autour de 600 €/an pour 1 000 services.

Notre recommandation pour les PME : commencez avec la Raw Edition. Elle couvre 90 % des besoins. Vous migrerez si nécessaire — la transition est transparente.

Installation pas à pas

Prérequis

  • Un serveur Linux (Debian 12, Ubuntu 22.04 ou Rocky Linux 9 recommandés)
  • 2 Go de RAM minimum (4 Go recommandés pour 50+ hôtes)
  • 20 Go d'espace disque
  • Accès réseau vers les machines à superviser (port 6556 pour l'agent Checkmk, SNMP 161/162)

Déploiement en 10 minutes

L'installation de Checkmk repose sur le concept de site (instance isolée). Voici la procédure sur Debian/Ubuntu :

  1. Téléchargez le paquet depuis le site officiel checkmk.com
  2. Installez le paquet avec dpkg et résolvez les dépendances
  3. Créez un site avec la commande omd create monsite
  4. Démarrez le site avec omd start monsite
  5. Connectez-vous à l'interface web sur le port 5000 (ou via Apache)

L'ensemble prend littéralement 10 minutes sur un serveur vierge. Comparez avec les heures nécessaires pour configurer Nagios from scratch.

Déployer les agents sur vos machines

Pour superviser un serveur, Checkmk a besoin d'un agent installé dessus. L'agent est un simple script qui collecte les métriques et les expose sur le port TCP 6556.

  • Linux/macOS : script shell léger, installable via paquet .deb/.rpm
  • Windows : agent MSI avec service Windows intégré
  • Équipements réseau : pas d'agent nécessaire, Checkmk interroge via SNMP

La force de Checkmk : une fois l'agent installé, l'outil découvre automatiquement tous les services pertinents (disques, interfaces réseau, processus, mises à jour…). Vous n'avez qu'à valider la liste proposée.

Configuration : les bonnes pratiques pour PME

Organisez vos hôtes par dossiers

Checkmk utilise une arborescence de dossiers pour organiser les hôtes. Structurez-la selon votre réalité :

  • Par site géographique : Bureau principal / Agence / Datacenter
  • Par type : Serveurs / Postes de travail / Réseau / Imprimantes
  • Par criticité : Production / Test / Développement

Cette organisation facilite l'application de règles (seuils d'alertes, contacts de notification) à des groupes entiers.

Définissez des seuils d'alerte pertinents

Par défaut, Checkmk applique des seuils raisonnables. Mais chaque environnement est unique. Ajustez :

  • Espace disque : alerte à 85 %, critique à 95 % (les valeurs par défaut sont souvent trop basses)
  • CPU : alerte si la charge moyenne dépasse 80 % sur 15 minutes
  • RAM : attention sur les serveurs de bases de données — une utilisation élevée peut être normale
  • Température : critique au-delà de 70°C pour les serveurs physiques
  • Uptime : une alerte si un serveur critique redémarre sans intervention planifiée

Configurez les notifications intelligemment

Rien de pire qu'une supervision qui envoie 200 emails par jour. Vos équipes finiront par ignorer les alertes. Appliquez ces principes :

  • Agrégation : regroupez les alertes du même hôte dans un seul message
  • Escalade : email immédiat pour les critiques, résumé quotidien pour les warnings
  • Plages horaires : pas de notification entre 22h et 7h sauf pour les services critiques
  • Canaux multiples : email pour le suivi, Slack/Teams pour les urgences
  • Acquittement : obligez l'équipe à acquitter les alertes pour suivre la prise en charge

Les checks indispensables pour une PME

Infrastructure serveur

CheckPourquoi c'est important
Espace disqueUn disque plein = services en panne
État RAIDDétecter un disque défaillant avant la perte de données
Certificats SSLÉviter l'expiration qui bloque vos sites et services
SauvegardesVérifier que le dernier backup s'est bien exécuté
Mises à jourIdentifier les serveurs avec des patchs de sécurité en attente

Réseau

  • Bande passante des liens WAN et Internet : détectez la saturation
  • État des ports sur vos switches : repérez les ports qui tombent en flapping
  • Latence et perte de paquets vers vos services cloud (Microsoft 365, ERP SaaS…)
  • État des access points Wi-Fi : nombre de clients connectés, interférences

Services applicatifs

  • Bases de données : connexions actives, requêtes lentes, taille des tables
  • Serveurs web : temps de réponse, codes d'erreur HTTP
  • Files de messagerie : longueur de queue (un indicateur précoce de problème)
  • Active Directory / LDAP : réplication, expiration des comptes de service

Tableaux de bord et visibilité

Créez des vues métier

Au-delà du monitoring technique, Checkmk permet de créer des Business Intelligence (BI) views. L'idée : agréger l'état de plusieurs services techniques en un indicateur métier compréhensible.

Par exemple :

  • Service email = état du serveur Exchange + connectivité Internet + certificat SSL + espace disque
  • Site web = serveur web + base de données + certificat + DNS

Si l'un des composants passe en warning, l'indicateur métier le reflète. Votre direction voit d'un coup d'œil si les services critiques fonctionnent, sans comprendre les détails techniques.

Graphiques et tendances

Checkmk stocke l'historique des métriques sous forme de graphiques RRD (Round Robin Database). Vous pouvez :

  • Visualiser l'évolution de la charge CPU sur 30 jours
  • Identifier les tendances d'utilisation disque pour anticiper les achats
  • Comparer les performances réseau entre heures de bureau et heures creuses
  • Générer des rapports de disponibilité (SLA) pour vos clients internes

Cas concret : PME de 30 postes à Lyon

Prenons l'exemple d'une PME lyonnaise de 30 collaborateurs avec :

  • 2 serveurs physiques (hyperviseur Proxmox + NAS Synology)
  • 1 switch manageable 48 ports
  • 3 bornes Wi-Fi Ubiquiti
  • 1 firewall pfSense
  • 30 postes Windows
  • Services cloud : Microsoft 365, ERP SaaS

Déploiement Checkmk en une demi-journée

  1. Matin : installation de Checkmk Raw sur une VM dédiée (2 vCPU, 4 Go RAM)
  2. Déploiement des agents : script PowerShell pour les 30 postes Windows, agent Linux sur les serveurs
  3. Configuration SNMP : switch, bornes Wi-Fi, firewall
  4. Après-midi : ajustement des seuils, configuration des notifications par email + canal Teams

Résultat : 150+ services supervisés automatiquement. En une semaine, l'outil a détecté :

  • Un disque en RAID dégradé sur le NAS (remplacement préventif → 0 perte de données)
  • Un certificat SSL expirant dans 10 jours
  • Un poste Windows avec 98 % de disque utilisé (utilisateur stockant des vidéos personnelles)

Sans supervision, ces trois problèmes auraient été découverts… au moment de la panne.

Checkmk vs les alternatives : tableau comparatif

Checkmk vs Zabbix

Les deux outils sont souvent comparés. Zabbix est plus configurable mais plus complexe à mettre en place. Checkmk gagne sur la découverte automatique et la rapidité de déploiement. Pour une PME sans équipe monitoring dédiée, Checkmk est généralement le meilleur choix.

Checkmk vs Prometheus + Grafana

Prometheus excelle dans les environnements cloud-native et Kubernetes. Mais pour superviser un parc hétérogène (serveurs physiques, réseau, postes de travail), Checkmk est plus adapté. Les deux peuvent coexister : Checkmk pour l'infra classique, Prometheus pour les conteneurs.

Checkmk vs PRTG

PRTG est une solution propriétaire Windows avec une interface graphique attrayante. Gratuit jusqu'à 100 capteurs, mais les licences grimpent vite au-delà. Checkmk Raw offre un monitoring illimité sans coût de licence.

Aller plus loin : automatisation et intégration

API REST

Checkmk expose une API REST complète. Vous pouvez :

  • Ajouter des hôtes automatiquement depuis votre CMDB ou Active Directory
  • Déclencher des actions de remédiation automatique (redémarrage de service, nettoyage disque)
  • Intégrer le monitoring dans vos pipelines CI/CD
  • Synchroniser les alertes avec votre outil de ticketing (GLPI, Jira, ServiceNow)

Plugins personnalisés

Checkmk supporte les plugins Nagios existants et propose son propre format de plugins. Vous pouvez surveiller n'importe quelle métrique spécifique à votre métier : nombre de commandes en attente, état d'une API partenaire, température d'un local technique…

Les erreurs à éviter

  1. Tout superviser sans prioriser : commencez par les services critiques, puis élargissez progressivement
  2. Ignorer les alertes warning : un warning aujourd'hui est souvent une panne demain
  3. Ne pas documenter : notez pourquoi chaque seuil a été modifié et par qui
  4. Oublier de superviser le superviseur : votre serveur Checkmk lui-même doit être surveillé (par un check externe ou un second site)
  5. Négliger les mises à jour : Checkmk publie des patchs de sécurité réguliers

VaultAura : votre partenaire supervision à Lyon

Mettre en place une supervision efficace demande du temps et de l'expertise. Chez VaultAura, nous accompagnons les PME lyonnaises dans le déploiement et la gestion de leur monitoring IT :

  • Audit de votre infrastructure pour identifier les points critiques à surveiller
  • Installation et configuration de Checkmk adaptée à votre environnement
  • Formation de vos équipes à l'utilisation des tableaux de bord
  • Supervision managée : nous surveillons votre infrastructure 24/7 et intervenons en cas d'alerte

Ne laissez plus les pannes vous surprendre. Contactez VaultAura pour un diagnostic gratuit de votre infrastructure et découvrez comment la supervision proactive peut transformer la fiabilité de votre système d'information.


VaultAura — Solutions informatiques professionnelles à Lyon. Infogérance, cloud et cybersécurité pour les PME.

Partager cet article :