Interview mit Stefan Brock, HPE

Andrea Gillhuber,

Warum KI Datenverständnis braucht

Der Erfolg von KI in der Industrie hängt weniger von Algorithmen als von Datenqualität und Kontext ab. Im Interview mit Stefan Brock von HPE wird deutlich, warum Metadaten, Governance und Fachwissen aus der Produktion entscheidend sind und welche Rolle Menschen weiterhin spielen.

Stefan Brock ist Leiter des KI-Exzellenzzentrums Zentraleuropa bei HPE (Hewlett Packard Enterprise). © HPE

Was versteht man unter datenzentrischer KI im industriellen Umfeld?

Stefan Brock: Ausgangspunkt ist die datenzentrische Architektur: Daten werden als eigenständiges Kern-Asset in den Mittelpunkt gestellt. Klassisch kommen wir aus IT- und OT-Architekturen, in denen Sensoren, Aktoren, Roboter oder Applikationen im Fokus stehen, also der konkrete Prozessschritt, den man automatisieren will.

Die datenzentrische Sicht dreht das um. Sie sagt: Egal, wo Daten entstehen oder gespeichert werden, sie stehen im Zentrum. Dadurch entsteht eine neue Freiheit im Umgang mit ihnen, weil man sie aus unterschiedlichen Perspektiven nutzen kann.

Im Kern gilt: Alles, was passiert, sind Events, also Daten. Wenn ich diese Ereignisse betrachte, kann ich sie in Echtzeit für KI nutzen. Das unterscheidet sich vom klassischen KI-Einsatz, bei dem man mit Machine Learning auf historischen Daten Muster erkennt und daraus Aktionen ableitet.

In der datenzentrischen KI wird jedes Event als Live-Ereignis verarbeitet. Dadurch kann die KI direkt im laufenden Produktionsumfeld agieren. Das ist der zentrale Unterschied: Wir bewegen uns in die operative Realität der Produktion und verarbeiten Daten in Echtzeit oder nahe Echtzeit.

Anzeige

Sie haben Rahmenbedingungen angesprochen. Welche sind das konkret?

Ein Beispiel aus der Applikationswelt: Eine Bestellung im SAP-System durchläuft verschiedene Stationen: Bedarfsträger, Freigabe, Einkauf, Lieferant. Jeder dieser Schritte ist ein Event. In einer datenzentrischen Architektur müssen diese Events mit Metadaten angereichert werden: Was ist das? Welche Bedeutung hat es?

Zusätzlich brauche ich Klassifizierungen: Sind Daten vertraulich, öffentlich oder personenbezogen? Gerade bei KI ist das entscheidend, weil ich verhindern muss, dass etwa personen-bezogene Auswertungen entstehen, wenn sie nicht gewollt sind. Das führt direkt zu Data Governance.

Im OT-Bereich kommt eine weitere Ebene hinzu. Nehmen wir einen Temperatursensor: Ich muss wissen, welcher Sensor das ist, welche Toleranz er hat und wo er verbaut ist. Ein Sensor in einem klimatisierten Raum liefert andere Aussagen als einer an einer Hallentür mit starken Schwankungen. Selbst baugleiche Sensoren unterscheiden sich je nach Hersteller oder Zustand.

Für KI-Anwendungen wird daraus ein Trust Level: Wie vertrauenswürdig sind die Daten? Ist der Sensor neu oder veraltet?

Kurz gesagt: Metadaten, Klassifizierung und Governance sind die zentralen Rahmenbedingungen. Wer datenzentrisch arbeitet, muss sich mit den Daten selbst beschäftigen und zwar unabhängig von der Applikation.

KI-Modelle werden in der Regel mit historischen Daten trainiert. Ab wann gelten Daten als ‚alt‘?

‚Alt‘ ist weniger eine Frage des Alters als der Eignung. Für Training brauche ich große, konsistente und präzise Datensätze. Wenn ich etwa Sensoren falsch klassifiziere, entstehen Ausreißer, die die Datenqualität verschlechtern. Das erhöht die Ungenauigkeit und bei generativer KI auch die Wahrscheinlichkeit von Halluzinationen.

Der notwendige Zeithorizont hängt vom Anwendungsfall ab: In der Landwirtschaft können zehn Jahre Satellitendaten sinnvoll sein; in einer Produktionslinie, die erst seit sechs Monaten läuft, reichen diese sechs Monate, weil sie genau die aktuelle Konfiguration abbilden.

Wichtig ist: Je konsistenter und umfangreicher die Daten, desto besser das Modell.

Wenn wir zurück zur datenzentrischen KI gehen: Welche Edge-Architektur braucht man dafür?

Ich spreche bewusst von ‚nahe Echtzeit‘, weil echte Echtzeit im Millisekunden-Bereich liegt, etwa bei Robotersteuerungen.

Für viele industrielle Anwendungen reicht es, Entscheidungen in Sekundenbruchteilen zu treffen: Material nachsteuern, Warnsignale auslösen oder Anlagen stoppen. Ein Beispiel ist Kollisionsvermeidung in Logistikzentren: KI erkennt Bewegungen von Menschen und Fahrzeugen und kann im Zweifel automatisch bremsen.

Architektonisch bedeutet das: Das Inferencing, also die Anwendung der KI, muss an der Edge stattfinden, direkt in der Produktionsumgebung. Durch die enorme Leistungssteigerung moderner GPUs ist das heute praktikabel, auch für den Mittelstand. Daten müssen das Gelände nicht verlassen, was Vorteile bei Latenz, Kosten, Datensicherheit und IP-Schutz bringt.

Typisch ist: Modelle – oft Open Source – werden lokal feinjustiert und direkt an der Fertigungsstraße betrieben. Das ist aktuell ein klarer Trend, insbesondere mit agentischen Systemen an der Edge.

Wie sieht dann die passende Datenarchitektur aus?

Grundlage ist eine eventbasierte Architektur: Alles, was passiert, wird als Event modelliert. Technologisch kommen hier beispielsweise Messaging-Systeme wie Kafka zum Einsatz, ergänzt durch Data-Fabric-Ansätze für verteilte Umgebungen.

Parallel dazu erfolgt die Anreicherung mit Metadaten. Früher wurde das manuell gemacht, heute zunehmend automatisiert. Es gibt Tools und Open-Source-Projekte, die Datenstrukturen erkennen und Vorschläge machen. Wichtig ist, dass diese Beschreibung über den gesamten Lebenszyklus hinweg gepflegt und aktualisiert wird.

Generative KI kann hier als Co-Pilot dienen. Wir sprechen intern von ‚Padawan‘: ein Assistenzsystem, das Datenquellen analysiert und Vorschläge für Semantik und Klassifikation liefert. Der Mensch validiert diese Vorschläge.

Events sind Momentaufnahmen. Wie stellt man Zusammenhänge über Prozesse hinweg her?

Über Kontext und Semantik. Ein isoliertes Event hat wenig Wert. Erst durch die Einordnung, etwa in einen Geschäftsprozess oder Versuchsaufbau, wird es relevant.

In der Forschung, zum Beispiel in der Chemie, ist das besonders deutlich: Dort werden Versuchsreihen mit vielen Parametern durchgeführt. Wenn ich genau dokumentiere, welche Sensoren, Reihenfolgen und Bedingungen vorlagen, kann ich aus wenigen Experimenten große Datenräume extrapolieren.

Die Metadaten schaffen also die Verbindung zwischen einzelnen Events.

Welche Rolle spielen Menschen in diesem Setup?

Eine sehr zentrale Rolle. Die IT stellt Infrastruktur, Sicherheit und Betrieb sicher, aber die fachliche Bedeutung der Daten kommt aus den Fachbereichen. Ein IT-Architekt kann Datenformate und Schnittstellen definieren, aber nicht die inhaltliche Bedeutung, zum Beispiel, was ein bestimmter Messwert im Kontext eines Produktionsprozesses bedeutet. Deshalb kommen Data Owner aus den Fachbereichen: Produktion, Engineering, Finance, HR. Sie verantworten Semantik, Klassifikation und Nutzung der Daten.

Organisatorisch sieht man oft Data-Governance-Boards oder ‚Center of Excellence‘, die diese Themen bündeln.

Liegt die Verantwortung eher beim Management oder in der operativen Ebene?

Die Accountability liegt letztlich in der Fachverantwortung, ähnlich wie bei Arbeitssicherheit. Delegation ist möglich, aber die Verantwortung bleibt. In der Praxis sind es häufig Produktionsleiter oder Bereichsverantwortliche, die diese Rolle übernehmen.

KI gilt oft als teuer. Wie argumentiert man den notwendigen Initialaufwand?

Im Grunde wie jede Investition in Produktionsmittel. KI wird häufig fälschlich als reines IT-Thema betrachtet. Tatsächlich ist es ein Bestandteil der Produktion. Wenn man das so einordnet, wird die Investition vergleichbar und nachvollziehbar: Eine Fertigungsstraße oder ein Roboter ist ebenfalls ein großer CapEx mit langfristigem Nutzen

Unternehmen, die KI in den Fachbereichen verankern, sehen sie als strategische Investition. Dort stehen eher Personal- als Infrastrukturkosten im Fokus.

Ein Scheitern sieht man oft bei rein IT-getriebenen Pilotprojekten ohne operativen Bezug.

Wie beeinflusst datenzentrische KI Geschäftsmodelle?

Schon ohne KI schafft eine datenzentrische Architektur Transparenz. Ein Beispiel: Durch bessere Datensichtbarkeit lassen sich redundante Systeme identifizieren und abschalten – mit erheblichen Kosteneinsparungen.

Mit KI entstehen zusätzliche Vorteile: schnellere Entscheidungen, bessere Prognosen und neue Optimierungsmöglichkeiten. In der Logistik etwa können Verspätungen frühzeitig prognostiziert werden, basierend auf Echtzeitdaten und historischen Mustern. Das schafft klare Wettbewerbsvorteile.

Branchen wie Logistik oder Handel sind bereits stark datenzentrisch, im Mittelstand gibt es hier noch großes Potenzial.

Was ist wichtiger für den Wettbewerbsvorteil – Datenqualität oder KI? Und welche Rolle spielen Stammdaten?

Datenqualität ist die Grundlage, denn ohne gute Daten kann KI keinen Mehrwert liefern. Stammdaten sind dabei essenziell; sie waren schon immer zentral für Analytics. Heute kann KI helfen, deren Qualität zu verbessern, beispielsweise durch das Erkennen von Dubletten oder Inkonsistenzen.

Gerade bei Kundendaten ist das ein klassisches Problem, das sich mit KI deutlich effizienter lösen lässt.

Woran scheitern KI-Projekte am häufigsten?

An zwei Punkten: Daten und Menschen. Schlechte Daten führen zwangsläufig zu schlechten Ergebnissen. Und wenn Mitarbeitende KI als Bedrohung wahrnehmen, sinkt die Datenqualität und damit der Projekterfolg. Auch auf Managementebene ist Verständnis entscheidend: Wer die Bedeutung von Daten nicht versteht, kann KI nicht sinnvoll steuern.

Technische Hürden sind meist lösbar. Die eigentlichen Herausforderungen liegen in Daten und Organisation.

Ersetzt KI den Menschen?

Nein. KI ist im Kern Statistik und Mathematik, sprich: ein Werkzeug. Sie erweitert menschliche Fähigkeiten, ersetzt sie aber nicht. Kreativität, Kontextverständnis und soziale Interaktion bleiben menschliche Domänen.

KI kann ein sehr leistungsfähiger ‚Companion‘ sein, der Effizienz steigert und neue Möglichkeiten eröffnet.

Herr Brock, vielen Dank für das Gespräch.

Web-Tipp

Mehr zum Thema Künstliche Intelligenz lesen Sie in unserem Online-Spezial:

https://bit.ly/CuA_KI

  • Xing Icon
  • LinkedIn Icon
Anzeige
Anzeige

Das könnte Sie auch interessieren

Anzeige
Anzeige
Anzeige

Codesys

Schneller mit dem "KI-Kollegen"

Die Integration von KI in Engineering-Tools eröffnet neue Möglichkeiten für die SPS-Programmierung. Über das MCP können Sprachmodelle direkt auf Codesys-Projekte zugreifen. Das ermöglicht eine automatisierte Unterstützung bei der Codeerstellung,...

mehr...
Anzeige

Getac

Für anspruchsvoller Edge-KI-Anwendungen

Getac bringt mit dem Tablet 'G140' einen robusten ‚Copilot+-PC‘ auf den Markt. Mit einem AMD Ryzen AI 5 340/ 7 350 CPU, AMD Radeon 840M/ 860M GPU und AMD XDNA 2 NPU (bis zu 50 TOPS) liefert es nahtlose, KI-gestützte Verarbeitung direkt am Einsatzort.

mehr...
Anzeige
Anzeige
Anzeige
Jetzt Newsletter abonnieren