Monitoring Setup
Mit Hilfe dieses Moduls wird konfiguriert, wie Geräte überwacht werden und wie Benutzer benachrichtigt werden, wenn Devices ausfallen.
Die Idee hinter "Monitoring-Setup" ist es, Filter zu definieren, die auf ein einzelnes oder mehrere (evtl. sogar hunderte) Ziele angewendet werden.
- Die Schwellwerte können individuell f¨r jedes Ziel definiert werden
- Zusätzlich kann festgelegt werden, ob SNMP-Traps und Syslog- oder Discovery-Ereignisse verworfen, weitergeleitet oder zum maximalen Level eskaliert werden sollen
- Man kann Vorlagen (Icon über dem Filter) verwenden oder auf den Link eines Zielgeräts klicken, um ein einzelnes Ziel zu matchen
- Durch Klick auf das Test-Icon wird die Erreichbarkeit eines Devices getestet
- Die Auswahl der Aktion "Alert" oder "Ereignisse" aus der Liste wendet diese als Filter an
Überwachung
- Auswahl des Tests
. Als Standard wird bei Switches und Routern die SNMP-Uptime überprüft
- Durch Auswahl von "Nein" wird die aktive Abfrage ausgesetzt. Dies kann als Wartungs-Modus genutzt werden oder wenn lediglich Event-Aktionen oder Discovery-Schwellwerte bei einem Device gesetzt werden sollen
- Das Protokoll "icmp" kann verwendet werden, wenn ein TCP-Ping bei einem Zielgerät nicht funktioniert. Die Anzahl zu sendender Pakete kann in
definiert werden, wenn mehr als ein Paket gesendet werden soll
- Test der Erreichbarkeit per "http" oder "https": Durch Eingabe eines Strings wie "index.html" im Feld
und einem regulärem Ausdruck, der auf die erfolgreiche Antowrt passt in
. Andernfalls wird lediglich ein "SYN"-Check (TCP-Ping auf Port 80) ausgeführt
- Test DNS: es kann ein Hostname und ein Regexp mit der passenden IP-Adresse verwendet werden
- Test NTP: es können RFC2030-Felder wie "Stratum" gesendet werden und durch einen Match auf ^[1-5]$ getestet werden, ob der NTP-Server noch synchron ist
- Durch Klick auf "Update" werden die Einstellungn auf die dargestellten Zielgeräte angewandt
- Durch Klick auf "Löschen" werden die angezeigten Zielgeräte aus dem Monitoing entfernt
- Im Falle eines "Incidents" kann entweder eine Alarmierung per Email oder SMS selektiert werden oder lediglich ein "Monitorig-Event" erzeugt werden. Oder aber keine Aktion erfolgen. Durch Auswahl einer "Wiederholung" wird der Alarm bei jedem hunderten fehlgeschlagenen Test erneut gesendet. Zusätzlich kann hier die Latenz für Zielgeräte angepasst werden
- Durch Klick auf
kann der Ausfall des ersten überwachten Zielgerätes simuliert werden
Ereignisse und Schwellwerte
Durch Auswahl von Weiterleitung kann eine Email versendet werden, wenn passende Ereignisse eintreffen. Um passende Einträge zu selektieren, kann ein Regexp auf den Inhalt oder aber der minimale Schweregrad des Ereignisse gesetzt werden
- Alternativ können passende Ereignisse auch verworfen werden. Sie werden dann auch nicht in der Datenbank gespeichert. Eine Weiterleitung übersteuert dabei das Verwerfen eines Ereignisse. Die Begrenzung des Levels kann lediglich zur Weiterleitung oder zum Verwerfen eines Ereignisse genutzt werden, nicht für beides
- Durch einstellen eines Regexp für Maximum wird das Level eines Ereignisse auf 250 (Emergency) erhöht. Diese Ereignisse der letzten 24 Stunden werden auch auf der Seite "Monitoring-Health" angezeigt. Dadurch können beispielsweise ausgefallene Netzteile oder Mitglieder eines Stacks identifiziert werden
- Die Benachrichtigungseinstellungen aus der Konfigurationsdatei "nedi.conf" können für jedes Gerät im Feld
überschrieben werden
- Device-spezifische Schwellwerte können in den Eingabefeldern
,
etc. gesetzt werden
Zurücksetzen
Aktiviert Abhängigkeiten, falls vorhanden mit Hilfe von Links oder Geräte-Informationen, wenn es sich um Netzknoten handelt. Im Anschluss können die Abhängigkeiten für jedes Ziel individuell angepasst werden
Aktualisierung der IP-Adresse der Geräte oder Netzknoten, falls diese sich geändert hat. Anzeige durch das Icon
im Status des Zielgeräts)
Zurücksetzen der Verfügbarkeitszähler (Status OK und nicht OK). Dies kann beispielsweise einmal pro Jahr erfolgen, falls die jährliche Verfügbarkeit der Zielgeräte ermittelt werden soll
- Wenn ein überwachtes Zielgerä nicht mehr in der Liste der Geräte oder Netztknoten gefunden wird, wird sein Status gelb hinterlegt (es sollte dann gelöscht werden)