Künstliche Intelligenz
Langfristige Lösungsfindung im Incident Response
Automatisierte, auf KI-Algorithmen basierende Abläufe unterstützen Incident-Management-Teams dabei, Vorfälle schneller zu erkennen und darauf zu reagieren. Durch die Integration von AIOps lassen sich Betriebabläufe optimieren und die Effizienz von ITOM-Teams steigern.
KI und maschinelles Lernen haben sich in den letzten Jahren rasant weiterentwickelt und sind in viele IT-Systeme und -lösungen integriert. Die Technologie hilft überlasteten ITOM-Teams (IT Operations & Management) bei der Lösung von Problemen und reduziert den manuellen Aufwand. KI definiert die Möglichkeiten im digitalen Betriebsmanagement neu. Aus dem IT-Betrieb, Operations oder kurz Ops, wird AIOPs. ,Artificial Intelligence for IT Operations´ bezeichnet den Einsatz von Künstlicher Intelligenz und maschinellem Lernen bei der Automatisierung von IT-Operationen und -Prozessen. Zu den Vorteilen gehören Verbesserungen im Monitoring, der Verwaltung und der Analyse von IT-Infrastrukturen. Anomalien, Trends und Probleme werden frühzeitig erkannt.
Die Grundlage von AIOps sind riesige Datenmengen und historische Erkenntnisse (Big Data). KI- und ML-Algorithmen identifizieren Muster, können Vorhersagen treffen und unterstützen so die menschliche Entscheidungsfindung. Mit der Verarbeitung natürlicher Sprache verstehen KI-gestützte Systeme sogar komplexe Zusammenhänge und können verständliche Texte ausgeben. Intelligente Empfehlungen und die Automatisierung sich wiederholender Aufgaben hilft den Unternehmen, Incidents schneller und effektiver lösen zu können. Davon profitieren sowohl die Unternehmen als auch die Kunden.
KI im Incident Management
Incident Management bezeichnet den Prozess der Identifizierung, Eskalation, Untersuchung und Behebung von unerwarteten Ereignissen (Vorfällen), die den normalen Betrieb von IT-Diensten oder Geschäftsprozessen beeinträchtigen. Das Ziel von Incident Management ist es, den Betrieb so schnell wie möglich wiederherzustellen und die Auswirkungen auf Benutzer zu minimieren. Langfristig müssen Lösungen gefunden werden, um zukünftige Vorfälle zu verhindern.
Doch vor allem mit dem strategischen Ziel der langfristigen Lösungsfindung tun sich Unternehmen schwer. Silo-artige Systeme zur Reaktion auf Vorfälle erschweren die Verarbeitung von Ereignisdaten; die Reaktionszeiten sind länger. Viele manuelle Prozesse belasten ohnehin schon überlastete ITOM-Teams zusätzlich. Mit Künstlicher Intelligenz lässt sich eine Vielzahl von Prozessen und Aufgaben im Incident Management automatisieren. Automatisierte, auf KI-Algorithmen basierende Abläufe unterstützen Incident-Management-Teams dabei, Vorfälle schneller zu erkennen und effizienter darauf zu reagieren. Weniger Zeitaufwand für manuelle Verrichtungen bedeutet mehr Zeit für strategische Aufgaben.
Der Einsatz von KI im Incident Management bietet aber noch eine Vielzahl weiterer Vorteile. KI kann große Mengen an Daten in Echtzeit analysieren, um abnormale Muster oder Verhaltensweisen zu identifizieren. Es lassen sich sogar Trends ableiten und potenzielle Risiken erkennen, noch bevor sie zu offensichtlichen Problemen werden. Dafür muss eine große Menge an Daten analysiert werden. Manuell ist das kaum lösbar. Das Beispiel der Anomalieerkennung zeigt, was nötig ist und wie es funktioniert.
Früherkennung von Anomalien
Im ersten Schritt werden mit Hilfe von Algorithmen des maschinellen Lernens (z.B. Clustering oder neuronale Netze) Modelle erstellt, welche das normale Verhalten der Systeme oder Prozesse repräsentieren. Das trainierte Modell wird dann auf Echtzeitdaten angewendet. Für den Abgleich mit der Baseline werden kontinuierlich Informationen aus verschiedenen Datenquellen gesammelt. Zu den Quellen gehören Log-Dateien, Serverprotokolle, Netzwerkdaten, Transaktionsprotokolle oder Sensordaten. Die gesammelten Daten müssen aufbereitet werden, um Rauschen zu reduzieren und relevante Informationen zu identifizieren. Dann werden die Merkmale oder Eigenschaften, welche ungewöhnliche Muster oder Verhaltensweisen zeigen, extrahiert. Solche Merkmale können sowohl höhere CPU-Auslastung als auch ungewöhnliche Transaktionsvolumina oder Benutzeraktivitäten sein.
Werden Abweichungen von den erwarteten Mustern erkannt, identifiziert das System diese als potenzielle Anomalie. Definierte Schwellenwerte zeigen an, wann eine Abweichung signifikant genug ist, um einen Alarm auszulösen. Bei Überschreitung des Schwellenwertes wird ein Alarm generiert und an das Incident-Management-Team weitergeleitet.
KI kann Incidents zudem automatisch klassifizieren und priorisieren. Tickets werden schneller den richtigen Teams zugewiesen und bei Bedarf wird rechtzeitig die Eskalation an höhere Ebenen veranlasst. Das Modell wird kontinuierlich überwacht und weiterentwickelt, um Fehlalarme zu reduzieren und seine Fähigkeit zur Erkennung neuer Anomalien zu verbessern. Eine wichtige Rolle in KI-gestützten Systemen sind sogenannte Expertensysteme. Der Zugriff auf die breite Wissensbasis solcher Systeme unterstützt Incident-Management-Teams mit konkreten Handlungsempfehlungen und hilft bei der Suche nach Lösungen für bekannte Probleme.
Wissensmanagement KI-gestützter Systeme
In KI-gestützten Systemen erfolgt das Wissensmanagement oft durch sogenannte Knowledge Graphs (Wissensgraphen). Dafür sammeln und speichern die Systeme das Wissen aus verschiedenen Quellen, wie Handbüchern, technischen Dokumenten, Lösungsdatenbanken und Expertenwissen, aber auch aus Chat-Protokollen und historischen Vorfällen. Dieser Prozess wird auch Datenaggregation genannt.
Die aggregierten Daten werden analysiert und indexiert. Im Zuge der Indexierung werden Entitäten wie Begriffe, Konzepte und Schlüsselwörter identifiziert, Inhalte kategorisiert und strukturiert erfasst. Entitäten können auch miteinander verknüpft werden, um Beziehungen zwischen ihnen zu erstellen. Die erstellte Wissensbasis ermöglicht es Benutzern, gezielt nach Informationen zu suchen und Fragen zu stellen. Ein entsprechendes Tagging erleichtert die Suche.
Relativ neu, aber wesentlich im Wissensmanagement ist die natürliche Sprachverarbeitung. KI-gestützte Systeme können durch Natural Language Processing (NLP) auch komplexe Anfragen verstehen.
KI-gestützte Plattformen und Lösungen sind inzwischen fester Bestandteil im Incident Management jedes modernen, datenzentrierten digitalen Unternehmens. Durch Integration von AIOps im Incident Management können Unternehmen den Betrieb optimieren und die Effizienz ihrer ITOM-Teams steigern. Die Kombination von KI und Compliance-Überwachung ermöglicht eine effizientere Einhaltung von Vorschriften wie der DSGVO durch die automatisierte Erkennung von Verstößen und die frühzeitige Warnung vor potenziellen Problemen. KI-gestützte Prozesse helfen außerdem, die Kundenerfahrung zu verbessern.















