Anforderungen
Redundanz¶
Das Monitoring System muss redundant sein. Bei Patchdays oder unerwarteten Ausfällen muss ein Zweitsystem Checks und Alarmierungen übernehmen können.
System Resourcen¶
Das System darf soll gut mit mehreren Cores/Threads umgehen können.
Alarmierung¶
Wann¶
- 24x7
- 10x5
Wie¶
- OpsGenie
- HipChat
- Telegram
Eintichtung¶
Flexieble einrichtung. Schwellwerte sollen Gruppenweise und individuell ohne viel Aufwand anpassbar sein. mehr als ca. 5 Arbeitsschritte zähle ich als zu aufwändig.
Vermeidung von doppelter erhebung von Informationen¶
Collectd und nagios3 sammeln mehr oder weniger die gleichen informationen. Eine möglichkeit wäre es, dass der eine Sammelt und der andere nur Auswertet und Alarmiert.
Last update:
April 18, 2020