Skip to main content

Monitoring

Mehr Kontrolle: Herausforderungen und Best Practice im Monitoring

In nahezu jedem Geschäftsprozess ist die IT mittlerweile elementarer Bestandteil, wodurch sich die Anforderungen an Überwachung und Reporting dramatisch verändert haben.

Interne IT-Abteilungen haben sich längst zu IT-Dienstleistern gewandelt, die anderen Geschäftsbereichen die benötigten Infrastrukturen und Applikationen als „Service“ bereitstellen.

Im Tagesgeschäft ist die Überwachung und Aufzeichnung von Performancedaten von Servern, Switches, Routern und einzelnen Diensten nur noch ein Teil der Herausforderung: Auch das frühzeitige und proaktive Benachrichtigen im Fehlerfall, um Ausfälle zu vermeiden und Stabilität sicherzustellen, ist für viele IT-Abteilungen eine Selbstverständlichkeit geworden.

Die eigentliche Herausforderung besteht heute darin, die Services gesamtheitlich zu monitoren und deren Verfügbarkeit auswertbar zu machen.

Ein guter Anwendungsfall ist der Service “E-Mail". Hierbei ist eine Vielzahl von Komponenten an der Aufgabenerfüllung beteiligt. Das Zusammenspiel aus Mail-Cluster, Firewall, Infrastruktur, Clients u.v.m. muss fehlerfrei funktionieren, damit Anwender E-Mails senden und empfangen können. Außerdem reicht es nicht aus, die Komponenten einzeln zu überwachen und zu benachrichtigen. Vielmehr müssen die Beziehungen der Services untereinander über logische UND/ODER/MINDEST-Operatoren als Gesamtservice dargestellt werden.

Auf Basis dieser umfassenden Überwachung kann eine geeignete Auswertung der Services als Ganzes erfolgen und somit deren Verfügbarkeit mit den vereinbarten SLAs überprüft werden.

Best Practice: Monitoring richtig aufsetzen

Ein Monitoring-Projekt beginnt sinnvollerweise mit einer strukturierten Planung und einer Anforderungsdefinition. An dieser Stelle sind besonders die Fachabteilungen gefordert, da nur sie die speziellen Anforderungen ihres Teilbereichs vollständig benennen können. Der Monitoring-Spezialist kann hier zwar wichtige Impulse liefern, entscheidet aber nicht, was für das Monitoring wichtig ist.

Alle Beteiligten einbeziehen

Ein weiterer elementarer Aspekt ist die Erwartungshaltung der betroffenen Mitarbeiter, da der Erfüllungsgrad der Erwartungen sich deutlich auf eine positive Akzeptanz des Tools auswirkt. Erfahrungsgemäß scheitern viele Projekte daran, dass die Erwartungshaltung nicht ausreichend berücksichtigt wurde.

„Inseln“ integrieren

Innerhalb eines Monitoring-Projekts ist der Umgang mit den vorhandenen Insellösungen ein heikles Thema. Auch bei auftretendem Widerstand sollte von Anfang an klar sein, dass diese „Inseln“ in ein zentrales Monitoring zu integrieren sind – denn für eine Korrelation und damit für ein übersichtliches Service-Monitoring müssen die Informationen zentral in einem System vorhanden sein.

Projektverantwortlichen benennen

Sind die oben angesprochenen Punkte geklärt, sollten alle Beteiligten die konkrete Projektdurchführung planen. Ein unzureichend geplantes Projekt ist langfristig zum Scheitern verurteilt, wenn Systeme immer weiter wachsen, bis sie nicht mehr wartbar sind oder sich niemand mehr dafür verantwortlich fühlt. Aus der Erfahrung heraus empfiehlt es sich einen Hauptverantwortlichen zu benennen, der sich federführend um die Weiterentwicklung des Projektes kümmert anstatt um die operative Umsetzung.

Überwachung definieren

Nach Einrichtung der Überwachungsmetriken folgt eine der schwierigsten Aufgaben bei der Einführung eines Monitoring-Systems: die Definition von Schwellwerten und Benachrichtigungen. Zu viele „False Positives“ führen langfristig dazu, dass die Meldungen nicht mehr ernst genommen werden und das Monitoring-System in Frage gestellt wird.

Monitoring ist ein Prozess

Abschließend noch einer der wichtigsten Aspekte – die Weiterentwicklung des Monitoring-Systems. Ein Monitoring-Projekt ist kein klassisches Projekt mit definiertem Start und Ende, sondern entwickelt sich kontinuierlich weiter. Dies sollte beim Bestimmen des Verantwortlichen für das Projekt bedacht werden. Das Monitoring entwickelt sich in der Regel bei jedem nicht erkannten aufgetretenen Fehler weiter, und muss dies auch. Nur so kann langfristig ein geeignetes und verlässliches Monitoring realisiert werden.

Praxisbeispiel Fraunhofer: Infrastruktur-Monitoring bei Europas größter Forschungsgesellschaft

Die IT-Abteilung der größten europäischen Forschungsgesellschaft stellt zentrale IT-Services für alle Forschungsstandorte im In- und Ausland bereit. Zur Überwachung der über 100 Services wird openITCOCKPIT eingesetzt. Intern „ITStats“ getauft, überwacht openITCOCKPIT nicht nur, ob alle Dienste reibungslos laufen, sondern generiert auch monatliche und vierteljährliche Berichte, die automatisch an die Service-Verantwortlichen verschickt werden. Tritt eine Störung auf, legt das System ein Ticket im Servicedesk-System an.

Das System umfasst derzeit 774 Hosts, 1211 Services und 65 Benutzer und deckt 98% der zentralen IT-Services ab. Fraunhofer arbeitet schon seit 2008 mit openITCOCKPIT. Im Laufe der Zeit entwickelte die IT-Abteilung des Fraunhofer Instituts das System schrittweise weiter, so dass die ITStats-Kachelkarte auf einen Blick die zentralen IT-Services anzeigt. Über ein Ampelsystem erfassen die Mitarbeiter sofort, bei welchen der zentralen Dienste ein Problem aufgetreten ist. Auch für Fraunhofer war neben der Offenheit des Systems professioneller Support wichtig, da die internen Personalressourcen beschränkt sind. Das System wird daher mit dem Hersteller it-novum gemeinsam betrieben.

Um die Qualität der Störungsmeldungen zu verbessern und lästige Falschmeldungen zu vermeiden, greift Fraunhofer auf Korrelationsmessungen in openITCOCKPIT zurück. Dazu werden pro zentralem IT-Service drei Einzelmessungen durchgeführt, wobei das System aber nur bei Vorlage von mindestens zwei Störungen die Störungsmeldung auslöst. Die Ergebnisse sind durch diese Verdichtung valider und aussagekräftiger geworden.

mehr Information

Vorteile beim Einsatz einer modernen Monitoring Software (am Beispiel von openITCOCKPIT)

  1. openITCOCKPIT 3 reduziert die Versendung von E-Mail- oder SMS-Benachrichtigungen und minimiert damit die Anzahl von „False Positives“. IT-Administratoren können sich auf tatsächlich kritische Störungen konzentrieren.
  2. Individuell konfigurierbare Dashboards in openITCOCKPIT 3 unterstützen die Erstellung von für die jeweilige Business Unit relevanten Ansichten, z.B. Helpdesk oder Admins. Aber auch IT-ferne Fachbereiche und das Management erhalten jeweils auf sie zugeschnittene Maps, Applets und Reports.
  3. Über ein feinkörniges Rollen- und Berechtigungskonzept kann in openITCOCKPIT der Zugang zu Modulen und Mandanten gesteuert werden.
  4. openITCOCKPIT verfügt über eine Weboberfläche, die sich dynamisch an die genutzten Endgeräte anpasst.
  5. Die webbasierte administrative Oberfläche von openITCOCKPIT erlaubt die Verwendung sämtlicher verfügbarer Checks für Naemon, Nagios und Check_MK.
  6. Mit seinem Event Korrelationsmodul ist openITCOCKPIT nicht nur in der Lage einzelne Metriken zu überwachen, sondern kann diese auch über logische Verknüpfungen in Verbindung bringen. Dadurch ermöglicht openITCOCKPIT das Monitoring von „(Business) Services“, anstatt nur die Überwachung einzelner Dienste.
  7. Mittels Auto Reports-Modul können für einzelne Dienste und korrelierte/ „Services“ werden Verfügbarkeitsreports erstellt und automatisiert versendet.
  8. Durch die von it-novum entwickelten Schnittstellen zu i-doit (CMDB) und OTRS (Ticketsystem) ist openITCOCKPIT nicht nur eine Monitoring-Lösung, sondern bildet eine vollständige ITSM Lösung.

 

Unser gesamtes ITSM Team ist ITIL zertifiziert!

it-novum GmbH Deutschland

Hauptsitz: Edelzeller Straße 44, 36043 Fulda

Niederlassung: Siemensdamm 50, 13629 Berlin

Niederlassung: Ruhrallee 9, 44139 Dortmund

 

info@it-novum.com

+49 661 103 - 322

+49 661 103 - 597

it-novum Niederlassung Österreich

Office Park 7 / Top B02

1300 Wien-Flughafen

 

 

info@it-novum.at

+43 1 227 87 - 139

+43 1 227 87 - 200