NRW:Arbeitsgruppe/Technik/Dokumentation/Monitoring/Nagios
Dienste: E-Mail | Lists | Webcache | Blogs | Wikimirror | Domains | RT | Mumble | LAN | Serverstatus
Inhaltsverzeichnis
Nagios Dienste Monitoring
Dokumentation zu Nagios des LV NRW.
Abstrakt
Der LV NRW bietet verschiedenste IT Dienstungen an. Um die Verfügbarkeit zu gewährleisten ist ein Monitoring aus Sicht des Nutzers ein wichtiger Bestandteil der Qualitätssicherung. Dazu wird das unter der GNU GPL stehende Projekt Nagios bzw. ein Derivat eingesetzt.
Ziel ist es eine schnelle direkte Alarmierung bei einem Ausfall eines Dienstes an das AG Technik NRW Team senden zu können. Des weiteren liefert es wertvolle historische Daten zur Verfügbarkeit.
Was Nagios leisten kann
- Host-Verfügbarkeit durch einfachen Ping-Test messen
- Service-Überwachung, Dienst wie z. B. http, MySQL, FTP, SSH, Logfile-Auswertung, Envirement-Status (CPU, Filesystem, FAN, USV) etc.
- Zentrale oder dezentrale Nagios-Struktur möglich mittels:
- Nagios Remote Plugin Executor, auch für Windows (NRPE_NT)
- Nagios Service Check Acceptor
- Check_by_SSH (Sicherheitsrichtlinien beachten, da verifizierung per Key)
- SNMP abfragen
- vielfältige Alarmierung z.B. durch eMail, Status-Webseite, SMS, Prowl, Syslog, RSS-Feed, VoIP und vieles mehr.
- Gruppen oder einzelne können alarmiert werden
- Wiederholung nach vorgegebener Zeitspanne
- Alarm-Eskalation an Gruppen oder einzelne nach Alarmwiederholung
- Alarmhistory in der Web-GUI
- Host- und Service-Anhängigkeiten
- Performance Daten Sammlung, einfache Darstellung per RRD-Graph
- Flexibilität bei der Prüfscript Erstellung (Shell, Perl, PHP, etc.)
- Eventhandler zur "Selbstheilung"
Was sind Nagios Check-Plugin´s
- Plug-ins sind eigenständige kleine Programme, bzw. Scripte
- Plug-ins können in unterschiedlichen Sprachen erstellt werden. Typisch sind Perl, Pythen, PHP, Shell-scripts
- Plug-ins können auf der Kommandozeile ausgeführt werden, um sie bspw. vor der Integration in Nagios zu testen.
- Plug-ins verwenden Parameter für die Testbedingungen; z. B. -H Host IP, -w Warning Kriterium, -c Critical Kriterium, -h Hilfe Text
- Plug-ins liefern den Status als Returncode 0, 1, 2 oder 3 zurück und einen Text-String als Information, die im Webinterface angezeigt wird.
- Plug-ins werden auf dem Nagios-Server, aber auch auf dem Remote-Host bei der Anwendung von NRPE oder check_by_ssh verwendet
Status Typen bei Notifications
In einem Alarm oder auf der Webseite werden verschiedene Zustände angezeigt.
- Für Hosts sind dies
- down, wenn der Host per Ping nicht erreicht werden kann
- unreachable, ?
- recover, wenn der Host wieder erreichbar wurde
- none, ?
- Für Services sind dies
- unkown, wenn der Zustand noch nicht klar festgestellt wurde
- warning, wenn der eingestellte 1. Schwellwert erreicht wurde
- critical, wenn der eigenstellte 2. Schellwert erreicht wurde
- recover, wenn der Dienst wieder zur Verfügung steht
- flapping, wenn der Status mehrfach wechselt
In der Configuratoin selbst werden nur die Anfangsbuchstaben, geschrieben. Also d,r oder w,c,r,f.
Zugang zum LV NRW Nagios Status
Derzeit ist für alle Administratoren ein Shared-User mit lese Rechte angelegt. Auf Anfrage bei x4v3r wird für ein Mitglied der AG Technik NRW ein persönlicher User-Account angelegt. Derzeit kann eine Notifizierung per eMail oder Prowl an den User gesendet werden.
(wird fortgesetzt)
Weiterführende Links
- http://www.nagios.org (Nagios System)
- http://www.nagiosexchange.org (Sammlung von Plugins, Addons, Extensions, …)
- http://www.nagios-wiki.de (deutschsprachiges Wiki)
- http://www.nagios-portal.de (Ein Online Forum)
- http://www.nagiosql.org (Ein Konfigurations-Tool)