NRW:Arbeitsgruppe/Technik/Dokumentation/Monitoring/Nagios

Aus Piratenwiki
Wechseln zu: Navigation, Suche
ACHTUNG: Die Informationen hier im Wiki sind momentan nicht vollständig aktualisiert.
AG Technik NRW
Verwaltung: Übersicht | Protokolle | Dokumentation | FAQ
Dienste: E-Mail | Lists | Webcache | Blogs | Wikimirror | Domains | RT | Mumble | LAN | Serverstatus


Nagios Dienste Monitoring

Dokumentation zu Nagios des LV NRW.


Abstrakt

Der LV NRW bietet verschiedenste IT Dienstungen an. Um die Verfügbarkeit zu gewährleisten ist ein Monitoring aus Sicht des Nutzers ein wichtiger Bestandteil der Qualitätssicherung. Dazu wird das unter der GNU GPL stehende Projekt Nagios bzw. ein Derivat eingesetzt.

Ziel ist es eine schnelle direkte Alarmierung bei einem Ausfall eines Dienstes an das AG Technik NRW Team senden zu können. Des weiteren liefert es wertvolle historische Daten zur Verfügbarkeit.


Was Nagios leisten kann

  • Host-Verfügbarkeit durch einfachen Ping-Test messen
  • Service-Überwachung, Dienst wie z. B. http, MySQL, FTP, SSH, Logfile-Auswertung, Envirement-Status (CPU, Filesystem, FAN, USV) etc.
  • Zentrale oder dezentrale Nagios-Struktur möglich mittels:
    • Nagios Remote Plugin Executor, auch für Windows (NRPE_NT)
    • Nagios Service Check Acceptor
    • Check_by_SSH (Sicherheitsrichtlinien beachten, da verifizierung per Key)
  • SNMP abfragen
  • vielfältige Alarmierung z.B. durch eMail, Status-Webseite, SMS, Prowl, Syslog, RSS-Feed, VoIP und vieles mehr.
  • Gruppen oder einzelne können alarmiert werden
  • Wiederholung nach vorgegebener Zeitspanne
  • Alarm-Eskalation an Gruppen oder einzelne nach Alarmwiederholung
  • Alarmhistory in der Web-GUI
  • Host- und Service-Anhängigkeiten
  • Performance Daten Sammlung, einfache Darstellung per RRD-Graph
  • Flexibilität bei der Prüfscript Erstellung (Shell, Perl, PHP, etc.)
  • Eventhandler zur "Selbstheilung"


Was sind Nagios Check-Plugin´s

  • Plug-ins sind eigenständige kleine Programme, bzw. Scripte
  • Plug-ins können in unterschiedlichen Sprachen erstellt werden. Typisch sind Perl, Pythen, PHP, Shell-scripts
  • Plug-ins können auf der Kommandozeile ausgeführt werden, um sie bspw. vor der Integration in Nagios zu testen.
  • Plug-ins verwenden Parameter für die Testbedingungen; z. B. -H Host IP, -w Warning Kriterium, -c Critical Kriterium, -h Hilfe Text
  • Plug-ins liefern den Status als Returncode 0, 1, 2 oder 3 zurück und einen Text-String als Information, die im Webinterface angezeigt wird.
  • Plug-ins werden auf dem Nagios-Server, aber auch auf dem Remote-Host bei der Anwendung von NRPE oder check_by_ssh verwendet


Status Typen bei Notifications

In einem Alarm oder auf der Webseite werden verschiedene Zustände angezeigt.

  • Für Hosts sind dies
    • down, wenn der Host per Ping nicht erreicht werden kann
    • unreachable, ?
    • recover, wenn der Host wieder erreichbar wurde
    • none, ?
  • Für Services sind dies
    • unkown, wenn der Zustand noch nicht klar festgestellt wurde
    • warning, wenn der eingestellte 1. Schwellwert erreicht wurde
    • critical, wenn der eigenstellte 2. Schellwert erreicht wurde
    • recover, wenn der Dienst wieder zur Verfügung steht
    • flapping, wenn der Status mehrfach wechselt

In der Configuratoin selbst werden nur die Anfangsbuchstaben, geschrieben. Also d,r oder w,c,r,f.

Zugang zum LV NRW Nagios Status

Derzeit ist für alle Administratoren ein Shared-User mit lese Rechte angelegt. Auf Anfrage bei x4v3r wird für ein Mitglied der AG Technik NRW ein persönlicher User-Account angelegt. Derzeit kann eine Notifizierung per eMail oder Prowl an den User gesendet werden.

(wird fortgesetzt)

Weiterführende Links