IT Monitoring unterliegt konzeptionellen Anforderungen, die wir mit Ihnen ausarbeiten. Hierzu gehören Abhängigkeiten der Komponenten genau so wie die Frage: „Was muss überwacht werden und warum?“. Das Monitoring kann Hardware (RAM, CPU, HDD, etc.), sowie Anwendungsschichten überwachen. Auf Anwendungsebene ist es sinnvoll, bestimmte Performance-Indikatoren wie z.B. Antwortzeiten zu messen. Im Weiteren können Log-Files auf eventuelle Fehler analysiert und so frühzeitig Ausfälle erkannt bzw. vermieden werden.

Monitoring Satelliten

Monitoring Satelliten dienen als abgesetzte Einheiten z.B. in einem anderen Netzsegment oder einer zu überwachenden Kundenumgebung. Die Satelliten werden durch einen Monitor-Master mit der Konfiguration versorgt und senden alle Checks über eine SSL Verbindung an den Master. Jegliche Konfigurationen von neuen Checks oder Änderungen werden auf dem Master durchgeführt und automatisch zum Satelliten übertragen. Die Darstellung der Ergebnisse kann auf beiden Systemen erfolgen und ermöglicht so einen partiellen Zugriff auf Monitordaten.

Monitoring Cluster und Load Balancer

Das Monitoring System wird durch einen Cluster hochverfügbar. Dieses Konstrukt dient gleichzeitig als Lastverteilung für die Checks und reduziert somit die load auf den einzelnen Checker-Instanzen.

Technik

Als Monitoring Plattform verwenden wir Icinga 2. Der auf Nagios (Industriestandart) basierende Fork ist mit allen Nagios Plugins kompatibel. Im Gegensatz zu Nagios wurden viele Schwachstellen behoben und die Konfiguration massive verbessert. Die folgenden Links zeigen ein paar technische Dokumentationen aus dem sberg Wiki.

Installation Icinga 2 auf Ubuntu mit Icinga Web 2 und PostgreSQL
Icinga 2 mit NRPE
Icinga 2 Satelliten Checker und Master
Setup Icinga 2 mit PNP4Nagios

Referenzen

WZAT GmbH: Über Satelliten alle wichtigen Systeme (Windows, Linux) überwacht sowie geprüft, ob Backups erfolgreich gelaufen sind. Anwendungsmonitoring überprüft Antwortzeiten und bestimmte Funktionen auf Ihre Rückgabewerte.

Cinema Mobile GmbH: Neben den Systemdaten werden vor allem anwendungsrelevante Daten geprüft. In diesem Fall werden Informationen aus Status Dateien gelesen und Log-Files auf Fehler untersucht.

« Zurück zur Startseite