Federation Architecture | Teil 3
Auf dem Weg zu industrietauglicher KI
OT steuert physische Prozesse und unterliegt daher präventiven und deterministischen Rahmenbedingungen. Moderne KI hingegen ist probabilistisch ausgerichtet und verbessert sich durch iteratives Lernen. Diese unterschiedlichen Paradigmen in Einklang zu bringen, bleibt eine der zentralen Herausforderungen der industriellen KI.
Die Teile 1 und 2 der Artikelserie "Federation Architecture" führten in die Föderierte Architektur (FA) ein und beleuchteten deren praktische Implikationen. Dieser Beitrag erläutert, wie FA die Voraussetzungen dafür schafft, dass OT-taugliche KI entstehen und skaliert werden kann.
FA basiert auf drei Prinzipien: Edge-Autonomie, unidirektionaler Datenfluss von OT zu IT und durch Menschen geprüfte Änderungen. Gemeinsam gewährleisten sie die Wahrung der OT-Kontrolle und der Sicherheitsgrenzen von KI, während zugleich Konvergenzvorteile realisiert werden. FA liefert damit die methodische Grundlage für die Integration und den Betrieb von KI in der OT. Zugleich zeigt dieser Beitrag, wie FA die Entwicklung von KI-Modellen unterstützt, die den Anforderungen der OT gerecht werden.
Eigenschaften von KI in Industriequalität für OT
KI-Modelle sind statistischer Natur und damit inhärent unvollkommen. Zwar existiert kein einheitlicher Standard für ‚industrietaugliche KI‘, doch weisen Richtlinien zur industriellen Sicherheit und zu KI-Governance (EU AI Act, NIST AI RMF, . . .) auf gemeinsame Erwartungen für Hochrisikoanwendungen hin. Ohne Anspruch auf Vollständigkeit ergeben sich für die Entwicklung von KI-Modellen unter Berücksichtigung von OT-Rahmenbedingungen und Governance folgende Erwartungen:
- zuverlässiger Betrieb innerhalb definierter Grenzen
- Auslegung und Validierung auf Basis risikoorientierter Methoden
- Nachverfolgbarkeit und Auditierbarkeit über den gesamten Lebenszyklus
- eine für Bedienpersonal und Auditoren angemessene Erklärbarkeit
Diese Erwartungen übersteigen, was viele heutige KI-Modelle leisten, und erfordern diszipliniertes Engineering sowie robuste Governance-Strukturen. Neben anderen Faktoren erklärt diese Lücke, warum industrielle KI nach wie vor ein Entwicklungsfeld ist.
Historisch betrachtet beruhten bedeutende Fortschritte in KI auf gemeinsamen Grundlagen wie Benchmarks, wiederverwendbaren Methoden und reproduzierbaren Implementierungen. Der frühe großskalige Erfolg des Deep Learning stützte sich auf öffentliche Benchmarks wie ImageNet. Die Transformer-Architektur, die modernen Large Language Models zugrunde liegt, verbreitete sich, weil sie über eine offen publizierte Methode eingeführt und anhand anerkannter Benchmark-Aufgaben evaluiert wurde. AlphaFold, ausgezeichnet mit dem Nobelpreis für Chemie, ist ein weiteres Beispiel dafür, wie breite Wirkung durch gemeinsame wissenschaftliche Infrastrukturen, offene Datenbanken und eine Open-Source-Implementierung ermöglicht wurde. In der OT sind solche Voraussetzungen schwerer zu schaffen. Die Datenvielfalt stellt oft die primäre Einschränkung dar. Seltene Fehler und sogenannte Long-Tail-Verhaltensweisen treten an einem einzelnen Standort nur spärlich auf, werden aber über viele Standorte hinweg und im Laufe der Zeit lernbar. Fine-Tuning und synthetische Daten können hier hilfreich sein, ersetzen aber nicht die reale Diversität, die organisationsübergreifend verfügbar ist. Daraus entsteht ein Anreiz für kollaboratives Training, ohne dass Organisationen ihre rohen Betriebsdaten teilen müssen.
Warum Unternehmen sich gegen ein organisationsübergreifendes, zentralisiertes KI-Training sträuben
Unternehmen zögern aus verschiedenen Gründen, betriebliche Daten über Organisationsgrenzen hinweg zu teilen:
- Wettbewerbsrelevantes Wissen: Prozessparameter, Fehlermodi und Effizienzkennzahlen spiegeln akkumulierte Expertise und Wettbewerbsvorteile wider. Die Weitergabe roher Betriebsdaten an Anbieter oder Dritte birgt das Risiko, dass Mitbewerber auf denselben Plattformen davon profitieren.
- Regulatorische Vorgaben: Allgemeine sowie branchenspezifische Regulierungen schränken die Weitergabe von Daten über Organisationsgrenzen hinweg häufig ein.
- Haftung: Die Verantwortung für durch Modelle verursachte Fehler ist nach wie vor unklar. Risikoscheue Organisationen lehnen daher eine Teilnahme ab.
- Vertrauen: Die Einbringung proprietärer Daten in von Anbietern kontrollierte Modelle wird häufig nicht akzeptiert.
Infolgedessen werden viele KI-Modelle in der OT auf begrenzten, standortspezifischen Daten trainiert und weisen zu wenig Robustheit auf. Das Federated Learning (FL) adressiert diese Einschränkung.
Von FA zur organisationsübergreifenden Modellentwicklung
Die Föderierte Architektur (FA) ermöglicht einen kontrollierten Datenfluss von der OT zur IT, wo die Rechenressourcen für Analytik und Modelltraining zur Verfügung stehen. Allerdings erreicht eine einzelne Organisation selten die notwendige Daten-vielfalt für anspruchsvolle OT-Anwendungsfälle.
Föderiertes Lernen bietet einen Mechanismus für die Zusammenarbeit, der auf die Weitergabe von Rohdaten verzichtet[1]. In FL gilt:
- Die Modelle werden lokal anhand proprietärer Daten trainiert.
- Nur Modellaktualisierungen (zum Beispiel Gradienten oder Gewichte) werden geteilt.
- Techniken wie Secure Aggregation und Differential Privacy[2, 3]sowie weitere FL-Verfahren werden eingesetzt, um die Preisgabe einzelner Beiträge zu reduzieren und das Risiko einer Rekonstruktion von Trainingsdaten aus Modell-Updates zu minimieren, abhängig vom jeweiligen Bedrohungsmodell und der Governance der FL-Allianz (Bild 1).
Das aggregierte globale Modell profitiert von verteilten Datensätzen aller Teilnehmer. Das Modell kann anschließend von den beteiligten Organisationen eingesetzt werden. Die Allianz kann sogar entscheiden, bestimmte Modelle breiter zugänglich zu machen, um Mehrwert für die gesamte Branche zu schaffen, sofern dies mit ihren Anreizen, Haftungsfragen und regulatorischen Rahmenbedingungen vereinbar ist.
Über die technischen Aspekte hinaus definiert FL auch Teilnahmebedingungen, Beitragsprüfungen, Benchmarks und eine kontrollierte Modellversionierung. Damit werden Validierung, Nachverfolgbarkeit und Auditierbarkeit in der Entwicklung OT-tauglicher Modelle unterstützt. In der Praxis kann die Allianz zu einem Governance-Forum werden, in dem teilnehmende Organisationen anwendungsspezifische Akzeptanzkriterien, Validierungsverfahren und Benchmark-Datensätze abstimmen und gemeinsam Modelle verbessern, ohne Betriebsrohdaten auszutauschen.
FA-Organisationen als natürliche FL-Teilnehmer
FA und FL adressieren unterschiedliche Ebenen: Die Föderierte Architektur strukturiert die IT/OT-Interaktion innerhalb einer Organisation, während das Föderierte Lernen die organisationsübergreifende Modellentwicklung ermöglicht. Dennoch sind Organisationen, die FA implementieren, gut aufgestellt, um an FL teilzunehmen:
- Kulturelle Ausrichtung: Die Föderierte Architektur etabliert eine organisatorische Vertrautheit mit kontrolliertem Datenaustausch: Operative Telemetriedaten werden nach oben übertragen, während sensible Betriebsdaten lokal verbleiben. Das Föderierte Lernen funktioniert nach dem gleichen Prinzip: Die Erkenntnisse aus den Modellen werden weitergegeben, die Trainingsdaten bleiben lokal.
- Trust-Architektur: Wenn ein Unternehmen Systeme aufgebaut hat, in denen "nichts ohne menschliche Freigabe in den Betrieb eingreift", fällt es ihm leichter, zu akzeptieren, dass "Modell-Updates eintreffen, jedoch unter kontrollierter Bereitstellung und Genehmigung eingesetzt werden".
- Regulatorische Konsistenz: Unternehmen, die aus Gründen der Datenhoheit eine Föderation einrichten, stellen fest, dass Föderiertes Lernen dieselben Einschränkungen im Kontext organisationsübergreifender KI adressiert.
- Anbieterunabhängigkeit: FL lässt sich standardisiert implementieren, sodass eine Teilnahme ohne Herstellerabhängigkeit möglich ist.
Selbst Organisationen, die bestimmte Datenkategorien nicht intern weitergeben dürfen, können teilnehmen, sofern lokale Rechenressourcen und Governance-Strukturen es erlauben, Modell- Updates vor Ort zu erzeugen und an einen Aggregator zu übermitteln.
KI auf OT-Niveau erweitert Edge-Autonomie
Edge-Autonomie erhöht die Resilienz, hat aber auch einen Preis: Sie erfordert hochqualifizierte Fachkräfte vor Ort. Unabhängig von FA besteht diese Herausforderung im OT-Sektor bereits seit Langem und es gibt zwei grundlegende Ansätze, sie zu adressieren:
- bidirektionale Konvergenz zur Ermöglichung zentralisierter Steuerung und Kontrolle
- intelligentere Abläufe vor Ort zur Senkung des lokalen Verwaltungsaufwand.
FA empfiehlt den zweiten als Ziel oder für diejenigen, die den ersten Ansatz verfolgen, als Zwischenstufe auf dem Weg dorthin. Die Edge-Autonomie und damit auch die FA lassen sich durch verantwortungsvolle KI-Automatisierung effektiv skalieren. FA und FL bilden dabei eine Art Schwungrad, das heißt einen Verstärkungszyklus. FA bereitet Organisationen darauf vor, OT-taugliche KI-Modelle zu nutzen und innerhalb einer FL-Allianz aktiv zu deren Entwicklung beizutragen. Dadurch entstehen zunehmend geeignetere Modelle, die wiederum dazu beitragen können, den lokalen Betriebsaufwand zu reduzieren und eine disziplinierte Edge-Autonomie leichter aufrechtzuerhalten. Dies erhöht die Anreize zur Teilnahme an FL sowie zur Investition in lokale Data Engineering-Kompetenzen und verbessert gleichzeitig die Qualität der FL-Modelle weiter (Bild 2).
Abschließende Bemerkungen zu Federated Learning
FL verbessert die Datensouveränität, indem rohe Trainingsdaten lokal verbleiben, eliminiert die Risiken jedoch nicht. Ohne geeignete Schutzmechanismen können Modell-Updates dennoch Informationen preisgeben, und stärkere Datenschutzmechanismen können die Modellleistung beeinträchtigen. Weitere Risiken:
- kompromittierte oder manipulierte ("backdoored") Updates
- unterschiedliche Datenqualität an verschiedenen Standorten
- verminderte Transparenz durch datenschutzwahrende Verfahren
Schon die Bildung solcher FL-Allianzen ist nicht trivial. Für die OT sollte FL daher nicht nur als technische Methode betrachtet werden, sondern ebenso als Betriebsmodell, das durch Governance, Teilnahmebedingungen und Standards definiert ist[4, 5].
Schlussfolgerung
Die Föderierte Architektur interpretiert die IT/OT-Konvergenz neu, indem sie sie als eine Reihe expliziter architektonischer Festlegungen versteht anstelle eines "Alles-oder-nichts"-Inte-grationsziels. Sie erhält die lokale Kontrolle aufrecht, beschränkt Schreibzugriffe auf OT-Systeme und erzwingt menschliche Überprüfung, während gleichzeitig zentrale Transparenz und Analytik ermöglicht werden.
Diese Struktur schafft eine praktikable Grundlage für OT-taugliche KI und stellt sicher, dass Modellentwicklung und -einsatz mit Governance-, Validierungs- und operativen Kontrollanforderungen im Einklang bleiben. Wo organisations-übergreifendes Lernen erforderlich ist, jedoch keine rohen Betriebsdaten geteilt werden können, erweitert FL diesen Ansatz über einzelne Organisationen hinaus, ohne Datensouveränität oder Sicherheit zu beeinträchtigen.















