Fraunhofer IKS
Framework für Daten- und KI-Lebenszyklus
Das Fraunhofer IKS entwickelt ein offenes, interoperables und technologieneutrales Framework, das den Daten- und KI-Lebenszyklus unterstützt und optimiert. Dadurch wird die Wertschöpfung durch KI deutlich gesteigert.
Industrie 4.0 beschreibt die fortschreitende Digitalisierung in der Produktion – Maschinen und Abläufe sind intelligent vernetzt, wodurch immer mehr Daten generiert werden können. Künstliche Intelligenz (KI) hat das Potenzial, aus diesen Daten Informationen zu generieren, um Produktion und Services zu verbessern. Mögliche Anwendungsszenarien sind vorausschauende Wartung (Predictive Maintenance), Optimierung und Automatisierung von Prozessen sowie Qualitätssicherung.
Allerdings kann dieses Potenzial aktuell noch nicht komplett ausgeschöpft werden, denn es existieren mehrere Technologiebarrieren, die die Generierung und Verarbeitung von Informationen einschränken und somit die Anwendung von KI erschweren.
| Forum Künstliche Intelligenz |
|---|
|
Die Autorin Hoai My Van spricht auf dem Forum Künstliche Intelligenz am 17. Mai 2022 im Science Congress Center Munich. Ihr Vortrag geht tiefer auf das hier vorgestellte Framework ein. |
Erstes Hindernis stellt die Multi-Vendor-Landschaft in den heutigen Produktionsstätten dar, sprich: Maschinen von unterschiedlichen Herstellern aus verschiedenen Technologiegenerationen mit unterschiedlichen Kommunikationsschnittstellen und -protokollen sowie Betriebssystemen existieren nebeneinander. Durch diese Heterogenität ist ein einheitlicher Datenzugriff nicht möglich. Stattdessen gibt es viele technologiespezifische Insellösungen, für die Domänenwissen benötigt wird. Zwar existieren bereits Standards wie die Verwaltungsschale (Asset Administration Shell), OPC UA, MQTT, doch sind immer noch viele proprietäre Lösungen im Einsatz. Dadurch sind aktuell noch keine einheitliche Kommunikation und einfache KI-Integration möglich.
Zweites Hindernis ist die fehlende Unterstützung für den Data Scientist. Dieser hat kein Domänenwissen, weswegen er bei der Beschaffung von Echtzeit- oder historischen Daten Unterstützung benötigt. Denn es sind keine automatisierten Datenanfragen möglich, es gibt keine Übersicht über Topologie und verwendete Technologien, und teilweise fehlen Metadaten. Folglich ist der Datenverarbeitungsprozess häufig mühsam, langwierig, manuell und koordinationsaufwendig.
Drittes Hindernis ist der inflexible KI-Betrieb. KI-Anwendungen werden oft starr in der Cloud oder auf einem lokalen Server betrieben. Dadurch haben die Anwendungen nicht die Möglichkeit, die vorhandenen Ressourcen optimal zu nutzen. Zusätzlich sind Aktualisierungen der KI-Modelle notwendig, um auf Änderungen in der Produktion angemessen reagieren zu können, wofür jedoch noch keine allgemeine Lösung existiert.
Framework basiert auf service-orientierten Architekturen
Bild 1: Beispiel für einen Daten- und KI-Lebenszyklus bestehend aus sechs KI-Services (Sechsecke): Datenakquise, Datenverarbeitung, Datenaggregation, KI-Training, Datenanalyse mithilfe von KI, KI-Monitoring.
© Fraunhofer IKSUm die Verwendung von KI in der Industrie 4.0 zu vereinfachen, entwickeln Forscherinnen und Forscher des Fraunhofer-Instituts für Kognitive Systeme IKS im Projekt „REMORA – Multi-Stage Automated Continuous Delivery for AI-based Software & Services Development in Industry 4.0“ ein offenes, inter-operables und technologieneutrales Framework, das Teile des Daten- und KI-Lebenszyklus unterstützt (Bild 1). Der Daten-Lebenszyklus bezieht sich in diesem Kontext auf die Schritte von der Datenentstehung über die Datenaggregation und Datenverarbeitung bis hin zur Datenanalyse – mit Unterstützung von KI. Und der KI-Lebenszyklus umfasst die Schritte vom KI-Training über KI-Deployment und KI-Betrieb bis hin zur KI-Überwachung und KI-Aktualisierung. Ziel des Frameworks ist:
- die Unterstützung eines Data Scientist durch vereinfachten Zugriff auf die benötigten Daten,
- eine flexible Integration von KI von der Komponentenebene bis hin in die Cloud,
- die Automatisierung des KI-Lebenszyklus.
Grundlage des Frameworks sind serviceorientierte Architekturen, in denen sich modulare KI-Services flexibel verteilen, austauschen und aktualisieren lassen. Ein KI-Service implementiert Teile des Daten- oder KI-Lebenszyklus. Die Form eines KI-Services kann vielfältig sein: ein direkt in die Komponentenebene integriertes KI-Modell, eine virtuelle Maschine auf der Edge, ein Container in der Cloud, etc.
Das entwickelte Framework stellt eine Bibliothek von unterschiedlichen Funktionalitäten für diese KI-Services zur Verfügung, die Entwicklung, Integration, Betrieb und Aktualisierung von KI-Anwendungen unterstützt und vereinfacht.
Ein Framework für die Stufen der Produktionsautomation
Je nach gewünschtem Automatisierungsgrad der Produktion kann das Framework für unterschiedliche Zwecke angewandt werden, z.B. für einen einheitlichen Datenzugriff, einen flexiblen Datenzugriff oder zur Unterstützung des KI-Lebenszyklus.
Ein wesentlicher Aspekt der Industrie 4.0 sind die Daten: Sie werden aggregiert, verarbeitet und analysiert, um Informationen und Mehrwert zu gewinnen. Diese Daten werden durch unterschiedliche Technologien und Kommunikationsschnittstellen bereitgestellt. Das Fraunhofer IKS möchte hierfür einen technologieunabhängigen Datenzugriff über eine einheitliche Schnittstelle zur Verfügung stellen.
Zudem kann der Datenzugriff weiter vereinheitlicht und vereinfacht werden. Ein einheitliches Informationsmodell zur Beschreibung einzelner Assets, z.B. Anlagen, Maschinen, Sensoren, Produkte, und deren vorhandenen Daten soll einen Austausch einzelner Assets ermöglichen, ohne dass Datenanfragen geändert werden müssen.
Mithilfe von KI ist zusätzliche Automatisierung möglich. Hierfür erlaubt das Framework die Verteilung und das Management von KI-Services, z.B. ein automatisiertes Retraining, und ermöglicht damit eine kontinuierliche, sich stetig verbessernde Datenanalyse.
Langfristig soll ein Framework entstehen, das sich automatisiert an die Infrastruktur und die Situation anpassen kann. Ein solches System könnte auf die Datenanalyse reagieren, z.B. durch automatisierte Anpassung der Maschinenparameter. Services wären in der Lage, kontinuierlich „zu wandern“, um stetig die Ressourcennutzung zu verbessern – aus mehreren Datenquellen, z.B. Kameras, ließe sich die „optimale“ auswählen. Die Datenanalyse an sich könnte optimiert werden, beispielsweise durch eine automatische Anpassung der Abtastfrequenz. Das Framework besäße die Fähigkeit, sich selbst bei Änderungen des Systems neu zu konfigurieren, z.B. nach einer Umrüstung oder dem Austausch einer Maschine. Kurzum: Die Möglichkeiten dieses Framework wären vielfältig.
Vier Komponenten, drei Ziele
Bild 2: Die vier Grundkomponenten des Frameworks: Dateninterface, KI Management, Service Management, Metadaten Management. KI-Services (links) nutzen Funktionalitäten des Frameworks, um einen Daten- und KI-Lebenszyklus zu realisieren.
© Fraunhofer IKSDas Grundkonzept des Frameworks sieht vier Komponenten vor (Bild 2):
- Das Dateninterface ist die Schnittstelle für einen Data Scientist oder den KI-Service. Über dieses Interface können Daten angefragt sowie KI-Modelle trainiert und betrieben werden. Es ermöglicht zum einen den technologieunabhängigen Datenaustausch über unterschiedliche Protokolle; und zum anderen ein einheitliches Trainieren, Validieren und Betreiben der KI-Modelle durch verschiedene KI-Plattformen. Das Framework unterstützt dabei gängige KI-Plattformen wie TensorFlow, Pytorch und sk-learn. Zusätzlich wird AutoML unterstützt, damit das Framework auch von KI-Anfängern verwendet werden kann.
- Für den Datenaustausch setzt das Fraunhofer IKS auf existierende Industrie 4.0-Technologien, wie Apache plc4x und BaSyx Virtual Automation Bus, für die Adapter zum Dateninterface entwickelt werden. Für weitere Protokolle wie MQTT, ROS und DDS werden separate Adapter entwickelt.
- Das Metadaten-Management beinhaltet zum einen die Verwaltung von ML-Metadaten zur Nachverfolgung der KI-Pipeline sowie der KI-Modelle von der Entstehung bis hin zur Nutzung. Zum anderen liefert es auch relevante Daten zum Verständnis des Problems, z.B. Metadaten zu einzelnen Maschinen oder eine Übersicht der Topologie. Diese Metadaten sind auch relevant, um die Flexibilität der Datenanalyse zu ermöglichen. Das Metadaten-Management basiert auf der Verwaltungsschale. Diese wird primär für die Dokumentation von Assets verwendet. Es ist jedoch auch denkbar, Datenvorverarbeitung oder gar die Datenanalyse durch ein KI-Modell direkt in der Verwaltungsschale durchzuführen.
- Das KI-Management ist für die Automatisierung des KI-Lebenszyklus zuständig. Es ermöglicht automatisiertes Retraining und eine automatisierte Verteilung der KI-Modelle, sowie die Versionierung und das Management der KI-Modelle an sich.
- Das Service-Management schließlich ist zuständig für die Services an sich. Es automatisiert die Erstellung sowie die Verteilung von Services. Zusätzlich werden die Services koordiniert, um den Datenfluss sicherzustellen. Für das Realisieren von Services und serviceorientierten Architekturen setzt das Fraunhofer IKS auf die Container-Lösung Docker. Alternativen, z.B. Virtuelle Maschinen, Virtuelle (Python) Umgebungen, sowie die Integration von KI-Modellen direkt in die Komponentenebene, sollen ebenfalls unterstützt werden.
Mit den beschriebenen Komponenten des Framewoks können die folgenden Ziele erreicht werden:
- Unterstützung eines Data Scientist durch vereinfachten Zugriff auf die benötigten Daten: Das Dateninterface ist die Schnittstelle für einen Data Scientist. Über diese Schnittstelle können Echtzeitdaten und historische Daten abgefragt werden, sowie die vom Metadaten-Management verwalteten Metadaten und die Topologieübersicht. Über das Dateninterface lässt sich ebenfalls das Service Management ansprechen, das für die Erstellung und Verteilung von KI-Services zuständig ist.
- Flexible Integration von KI von der Komponentenebene bis hin in die Cloud: Das Service-Management kann die Services – basierend auf den Ressourcen-Informationen aus dem Metadaten-Management – so verteilen, dass die Ressourcen optimal genutzt werden. Das KI-Management verteilt die KI-Modelle; das Dateninterface der KI-Services stellt den Datenfluss, also die Kommunikation zu anderen KI-Services oder Datenquellen, sicher.
- Automatisierung des KI-Lebenszyklus: Das Service-Management koordiniert die KI-Services. So kann z.B. einem KI-Trainingsservice kommuniziert werden, dass ein anderer KI-Service ein neu trainiertes KI-Modell benötigt. Das KI-Management setzt den Retraining-Prozess um und verteilt das neu trainierte KI-Modell.
Workflow mit KI-Unterstützung
So könnte ein Workflow mithilfe des Frameworks aussehen:
Der Domänenexperte liefert dem Framework Metadaten der Assets – einschließlich der verfügbaren Daten – sowie deren Beziehung zueinander. In bestimmten Situationen ist es auch denkbar, die Beziehung der einzelnen Assets automatisiert zu erkennen.
In den Produktivsystemen werden alle relevanten Daten in eine Datenbank eingespeist. Zusätzlich sind Metadaten verfügbar. Ein Data Scientist kann über das Dateninterface Zugriff auf diese Daten sowie eine Topologieübersicht erhalten. Basierend darauf wird ein KI-Modell und der zugehörige KI-Trainingsservice entwickelt. Ein Data Scientist implementiert den Service über das gleiche Dateninterface.
Für die Verteilung und den Betrieb der Services werden die relevanten Informationen definiert, z.B. benötigte und bereitgestellte Daten, benötigte Ressourcen sowie Optimierungsziele.
Der KI-Trainingsservice kann dann flexibel verteilt werden, z.B. auf einem Edge Device oder in der Cloud. Der Service trainiert ein KI-Modell basierend auf den historischen Daten und stellt es dann in einem Modell Repository bereit.
Der KI-Nutzer erstellt einen KI-Analyseservice, der sich ebenfalls flexibel verteilen lässt, z.B. nahe der Datenquelle. Dieser Service verwendet das trainierte KI-Modell, um Echtzeitdaten zu analysieren.
Ein zusätzlicher KI-Überwachungsservice kann parallel die Qualität der Analyse – und somit des KI-Modells – überwachen. Bei schlechter Modellqualität, aber auch bei Umrüstung oder bei neuen Daten, wird ein Signal für den Retraining-Prozess übermittelt. Das KI-Modell wird dann automatisiert neu trainiert und verteilt.
Modellanwendung demonstriert Funktionsweise
Bild 3: Demonstratoraufbau (links): Vier Stationen mit SPS-Steuerung, die ein Produkt zusammenstellen. Eine Kamera erfasst ein Bild des Endproduktes. Dieses wird mithilfe von KI auf Fehler analysiert (rechts). Ein Trainingsservice liefert dem Analyseservice ein trainiertes KI-Modell. Der Analyseservice kann ein Retraining im Trainingsservice auslösen
© Fraunhofer IKSUm das Framework zu testen, entwickelt das Fraunhofer IKS einen Demonstrator bestehend aus mehreren Stationen mit SPSen, die ein Produkt aus verschiedenen Einzelteilen zusammensetzen (Bild 3).
In diesen Demonstrator soll nun KI für Qualitätssicherung und Fehlervorhersagen integriert werden. Hierfür wird ein KI-Modell entwickelt, das Bilder des Endproduktes auf Fehler analysiert. Das Framework managt dieses KI-Modell und die benötigten KI-Services für Training und Betrieb, um zum Beispiel ein Retraining des Modells zu ermöglichen. Des Weiteren sollen Daten der einzelnen SPSen verwendet werden, um Fehler vorherzusagen. Neben den Echtzeit- daten sollen zusätzlich eine Topologieübersicht und Metadaten zur Verfügung stehen.
Das Framework ist zwar auf Industrie 4.0 ausgerichtet. Jedoch ist es auch in anderen Domänen verwendbar: Vor allem dort, wo eine hohe Menge an Daten (Maschinendaten, Prozessdaten) anfällt, die in Echtzeit mithilfe von KI analysiert werden sollen. Durch den Einsatz von flexiblen KI-Services passt sich das Framework an die vorhandene Infrastruktur an und Ressourcen können optimal genutzt werden.
Das Framework nutzt dann die vorhandenen Daten, um daraus Informationen und somit Mehrwert zu erzeugen. Eine Vernetzung der Produktion ist notwendig, um möglichst viele Daten verfügbar zu machen und die Verteilung von KI-Services zu ermöglichen. Für den Datentransfer unterstützt das Framework unterschiedliche Kommunikationsprotokolle.
Framework erleichtert KI-Zugang
Für die KI-Integration bringt das Framework die idealen Voraussetzungen mit. Es unterstützt und optimiert den KI-Lebenszyklus, indem es Flexibilität, Adaptivität und dezentrales und serviceorientiertes Management von KI-Services, sowie die (Semi-)Automatisierung von KI bietet. Zudem ist es offen, interoperabel und technologieneutral. Das Framework ermöglicht, existierende Lösungen wie Container und Komponentenintegration zu vereinen und flexibel zu nutzen. Unterstützt werden sowohl Industrie 4.0-Standards als auch proprietäre Technologien, wodurch Brown- und Green-Field-Ansätze möglich sind. Das einheitliche Dateninterface erleichtert den Zugriff auf die benötigten Daten – unabhängig der verwendeten Technologie. Eine Übersicht der Topologie und der Metadaten hilft dabei, das zu analysierende Problem zu verstehen.
Die Autorin: Hoai My Van ist Wissenschaftliche Mitarbeiterin am Fraunhofer IKS. Ihr Forschungsschwerpunkt liegt auf selbstadaptiven Systemen für und mit KI.
© Fraunhofer IKSHinzu kommt, dass man kein KI-Experte für die Nutzung des Frameworks sein muss: Durch die Unterstützung von AutoML können KI-Modelle ohne zusätzliches Wissen erstellt werden. Darüber hinaus finden Training, Betrieb, etc. durch eine einheitliche Programmierschnittstelle plattformunabhängig statt.
| Förderhinweis |
|---|
| Im Rahmen des Projekts „REMORA – Multi-Stage Automated Continuous Delivery for AI-based Software & Services Development in Industry 4.0“ entsteht ein Dateninterface für den einheitlichen und flexiblen Datenzugriff sowie ein Framework für den Daten- und KI-Lebenszyklus eine Referenzimplementierung für das Framework. Dieses Vorhaben wird durch das Bayerische Staatsministerium für Wirtschaft, Landesentwicklung und Energie gefördert und durch die Bayern Innovativ – Bayerische Gesellschaft für Innovation und Wissenstransfer mbH unterstützt. |


















