Nicht jedes Ereignis muss einen kritischen Status haben. Der Aufbau von Hochverfügbarkeits-Clustern und die Realisierung von Hochverfügbarkeit durch Virtualisierung ist längst normaler Bestandteil des IT-Arbeitsalltags. Beispielsweise funktioniert eine ESX Farm weiterhin ohne Probleme, selbst wenn ein Teil der ESX-Server nicht mehr verfügbar ist. Auch durch die virtuellen Maschinen bereitgestellten Services müssen dadurch noch nicht beeinträchtigt sein. In der Regeln sind die einzelnen Services redundant ausgelegt.
Doch oft führt erst die Verkettung einzelner Ereignisse zu einem kritischen Event, bei dem eine Alarmreaktion sinnvoll ist. Idealerweise bietet ein entsprechendes Framework nicht nur ein Regelwerk dafür, sondern auch die automatische Generierung einer graphischen Korrelationskarte für einen umfassenden Überblick.
Die Abbildung zeigt am Beispiel Mail, wie eine Eventkorrelation aussehen kann. Auf einen Blick ist erkennbar, ob es ein Problem mit dem Gesamtservice Mail gibt oder nur mit einem Teilbereich. Dadurch kann zum Beispiel ein Mail-Cluster-Node ausfallen, ohne dass der Gesamtservice beeinträchtigt wird.
Neben der grafischen Darstellung erlaubt openITCOCKPIT zusätzlich, Benachrichtigungen ebenenweise bzw. je korreliertem Service zu versenden. Dadurch kann beispielsweise Ebene 1 an die Administratoren benachrichtigt werden, weil für den Gesamtservice Mail bisher noch kein kritischer Zustand eingetreten ist. Die korrelierten Ereignisse in Ebene 2 hingegen können bereits darauf hinweisen, dass ein Teilbereich oder der Gesamtservice beeinträchtigt sind. Diese Information kann dann direkt an die IT-Leitung gegeben werden. Ist der Gesamtservice nicht mehr verfügbar, ist das im Normalfall auch für die Geschäftsleitung wichtig.