Weidmüller
Demokratisierung von Machine Learning
Die Software ‚Industrial AutoML‘ ermöglicht es Unternehmen, Machine-Learning-Modelle eigenständig zu realisieren – ohne Data Scientist. Dafür bringt der Applikationsingenieur sein Domänenwissen ein und die Software erstellt automatisch das ML-Modell.
Maschinelle Lernverfahren und künstliche Intelligenz setzen im Maschinen- und Anlagenbau wichtige technologische Impulse bei der Nutzung von Daten. Zahlreiche Unternehmen sehen datenbasierte Mehrwertdienste als entscheidend für ihr zukünftiges Geschäft. Daher setzen sie sich mit Datenanalyse-Lösungen auseinander, die Produktionsprozesse optimieren und/oder völlig neue datenbasierte Geschäftsmodelle schaffen können. Weidmüller will Maschinenbauer und -betreiber befähigen, Machine-Learning-Modelle (ML-Modelle) einfach und schnell zu erstellen und so die gesammelten Daten in konkrete Handlungsempfehlungen zu überführen.
Domänenwissen ist gefragt
Bisher analysieren Data Scientists die Daten und erstellen ML-Modelle. Dieser Prozess ist weitestgehend manuell und explorativ. Der Prozess der Modellbildung und der Erstellung der ML-Pipeline ist sehr komplex. Insgesamt gibt es bis zu 10 hoch 40 Kombinationsmöglichkeiten, um eine ML-Lösung aufzubauen. Die konkrete Ausgestaltung der ML-Pipeline ist zudem für jeden Anwendungsfall spezifisch. Weidmüller möchte die Anwendung des maschinellen Lernens so stark vereinfachen, dass Domänenexperten mit ihrem Wissen über die Maschine oder den Produktionsprozess eigenständig ML-Lösungen realisieren können – und zwar ohne Data-Science-Expertise.
Die Software Industrial AutoML führt den Nutzer durch den Prozess der Modellentwicklung; Weidmüller spricht hier auch von ‚Guided Analytics‘. Die Software hilft bei der Übersetzung und Archivierung des Applikationswissens der Domänenexperten in eine verlässliche Machine-Learning-Anwendung, indem sie das vorhandene Wissen abfragt und mit dem im Hintergrund arbeitenden ML-Verfahren kombiniert. Verglichen mit einem automatisierten Modellbildungsprozess verbessert sich die Modellgüte substanziell, wenn Domänenwissen integriert wird.
Die Industrial-AutoML-Lösung besteht im Wesentlichen aus zwei Modulen: Der ‚Modell Builder‘ und die Runtime decken den kompletten Zyklus der Entwicklung, Ausführung und Optimierung der ML-Modelle über ihren Lebenszyklus ab. Mit dem ‚Model Builder‘ kann der Anwender ML-Lösungen zur Anomalie-Erkennung, Klassifikation und Fehlervorhersage erzeugen. Dabei wird sowohl das überwachte als auch das unüberwachte maschinelle Lernen miteinander kombiniert und auf diese Weise das Domänenwissen in den Modellbildungsprozess integriert. Die Aufgabe des Nutzers ist es, in den Trainingsdaten das Normal- oder eventuelle Fehlverhalten der Maschinen zu markieren und gegebenenfalls eigene Features zu erzeugen, die für den Anwendungsfall besonders relevant sind. Dadurch entsteht ein mit Domänenwissen angereicherter Datensatz, auf dem das Training, die Optimierung und die Validierung alternativer ML-Modelle automatisch erfolgen.
Eine besondere Bedeutung bei diesem AutoML-Ansatz kommt dem Thema ‚Explainable AI‘ zu: Die Software Industrial AutoML ermöglicht es dem Domänenexperten, den Einfluss seines Applikationswissens auf die Modellgüte nachzuvollziehen und letztendlich zu verstehen, warum ein ML-Modell in einem bestimmten Analyse-Ergebnis mündet.
Das zweite Modul der Industrial-AutoML-Lösung ist die Ausführungsumgebung, die zum Betrieb der ML-Modelle in der Cloud oder in einer On-Premise-Anwendung sogar direkt an der Maschine dient. Die Ausführungsumgebung stellt die Modell-Ergebnisse verständlich dar, sodass der Nutzer konkrete Handlungen, beispielsweise zur Fehlervermeidung, umsetzen kann.
Kooperation zwischen Weidmüller und Microsoft
Seit einigen Wochen ist die Industrial-AutoML-Lösung über den Microsoft Azure Marketplace weltweit verfügbar. Im Rahmen dieser Zusammenarbeit bündeln beide Unternehmen ihre jeweiligen Stärken: Weidmüller bringt die Industrie- und Machine-Learning-Kompetenz für Anwendungsfälle aus dem Maschinen- und Anlagenbau ein. Die Trusted-Cloud-Infrastruktur und Azure-Dienste von Microsoft ermöglichen es, dass die Industrial-AutoML-Software von den Nutzern eingesetzt werden kann.
Dies umfasst sowohl einen schnellen Zugang über den Marketplace, als auch das einfache Deployment und die Skalierung im Betrieb. Die Zusammenarbeit der Unternehmen geht über einen technologischen Austausch hinaus: Weidmüller ist Teil des Partnernetzwerks von Microsoft und hat sich den ‚Co-Sell‘-Status erarbeitet. Damit treten Microsoft und Weidmüller auch gemeinsam am Markt auf und bieten ein Leistungspaket an. »Gemeinsam beschleunigen wir Maschinenbauer und -betreiber, ihr Domänenwissen in datenbasierte Innovationen und digitale Mehrwertdienste zu überführen, indem wir eine schnelle und einfache Adaption von ML- und IIoT-Technologien ermöglichen«, erklärt Tobias Gaukstern, Vice President Business Unit Industrial Analytics bei Weidmüller.
»Weidmüller ermöglicht die Demokratisierung von ML in der Industrie, indem sie einen Engpass entfernen: die Verfügbarkeit von teuren und nur zeitweise benötigten Data Scientists. Gleichzeitig bietet Weidmüller ein klares Vorgehensmodell und hilft das entscheidende Domänenwissen zu konservieren«, sagt Oliver Niedung, IoT-Spezialist bei Microsoft. »Kein Unternehmen kann oder sollte wirklich komplexe IoT-Lösungen allein bauen. Eine enge Zusammenarbeit in der Entwicklung und bei der Schaffung von globalen Marktplätzen ist wichtiger denn je. Hier war das Engagement mit Weidmüller absolut beispielhaft.«
Die Zusammenarbeit zwischen Weidmüller und Microsoft reicht von der Entwicklung über den ganzheitlichen Betrieb bis in die fortlaufende Innovation der Lösungen. Das ermöglicht dem Anwender einen Fokus auf ihr Geschäft, ihre Kompetenzen und ihre Differenzierung.
Machine-Learning-Anwendungen beschleunigen
Tobias Gaukstern, Vice President Industrial Analytics bei Weidmüller, erläutert im Interview die Funktionsweise von Industrial AutoML und welche Vorteile die Software für Anwender bietet.
Mit dem ‚Modell Builder‘ werden Daten vom Domänenexperten klassifiziert. Wie genau kann man sich das vorstellen?
Der Nutzer kann die Maschinendaten mithilfe eines intuitiv bedienbaren Graphical User Interface – kurz GUI – markieren und so bestimmte Zeitbereiche als normales oder nicht normales Maschinenverhalten kennzeichnen. Nach diesem Verfahren lässt sich auch jedes andere Verhalten oder jeder Zustand in den Daten markieren und bezeichnen. Das sogenannte Labeling oder auch Tagging kann der Nutzer anhand beliebiger Datenreihen vornehmen und so sein Applikationswissen mit dem Datensatz verknüpfen. Die Berechnung der Korrelationen zu allen anderen Datenreihen erfolgt dann anschließend im Rahmen der Modellbildung automatisch.
Was genau versteht man unter überwachtem und unüberwachtem maschinellen Lernen?
Beim überwachten Lernen liegt zu jeder Trainingsaufgabe die richtige Antwort in Form eines Labels vor. Bei einer Klassifikationsaufgabe zum Beispiel werden die gültigen Klassen sowie die Zuordnung von Zuständen zu den jeweiligen Klassen vorgegeben. Im Fall des unüberwachten Lernens existieren keine Labels zu den Trainingsdaten. Es sollen also Strukturen in den Daten erkannt werden, deren Kategorien zuvor nicht bekannt sind. Dazu werden unter anderem Clustering-Verfahren angewendet. Bei unserem Industrial AutoML-Produkt kombinieren wir beide Ansätze. So kann ein Modell zur Anomalie-Erkennung trainiert werden, ohne dass bestimmte Anomalien bekannt sind. Es wird also das unüberwachte Lernen eingesetzt, um das Normalverhalten zu lernen. Im Betrieb wird dann jede Abweichung vom gewünschten Verhalten als Anomalie erkannt. Sind zusätzlich konkrete Anomalien bekannt, lassen sich die ML-Modelle mit Hilfe des unüberwachten Lernen validieren.
Wie viele Trainingsdaten werden für ein ML-Modell benötigt?
Eine pauschale Antwort kann dazu nicht gegeben werden, da die notwendige Datenmenge von vielen Faktoren abhängt. Hier sind zum Beispiel die Abstraktheit der Daten, die Häufigkeit der Anomalie beziehungsweise der Fehler, die Anzahl der Features und der Datenspuren, die eine Korrelation zur Anomalie beziehungsweise zum Fehler aufweisen, zu nennen. Für den Start genügen in der Regel einige Megabyte an Trainingsdaten, um zu validieren, ob maschinelles Lernen für den Use Case geeignet ist und um ein erstes Modell zu trainieren. Wir sprechen hier also von einem Small-Data-Ansatz. Die Besonderheit unseres Ansatzes ist, dass bereits Trainingsdaten vom Normalverhalten einer Maschine ausreichen, um ein Modell zur AnomalieErkennung zu erstellen, wodurch sich fast jeder Anwender ohne Hürden auf die ML-Reise begeben kann.
Wie unterscheiden sich die vom Domänen-experten klassifizierten Daten von den ausgewählten Daten eines Data Scientist? Und inwieweit hätten Unterschiede Auswirkungen auf das Modell?
Der Ingenieur kann mit seinem Applikationswissen von Anfang an die Feature- und Zeitbereiche auswählen, die für den Use-Case relevant sind, und gleichzeitig mit den entsprechenden Labels versehen. Dieses Wissen kann der Data Scientist nicht einbringen, da er es in der Regel schlicht nicht hat. Dies gilt auch für Features, die der Domänenexperte zusätzlich kreiert. Dabei ist es ein großer Unterschied, ob der Domänenexperte sein Wissen direkt in den Datensatz einbringt, oder ob ein Data Scientist mit in dem Projekt eingebunden ist, der sich mühsam das Wissen erfragt und dann bei der Modellbildung berücksichtigt. Dieses spiegelt sich auch in der Modellperformance wider: Stark mit Domänenwissen angereicherte Modelle sind anderen Modellen üblicherweise überlegen – es kommt hier aber auch immer auf den Einzelfall an.
Die ML-Modelle werden von der Software automatisch generiert. Wie kann die Software wissen, welches Modell für die jeweilige Anwendung am besten geeignet ist?
Gerade die Kombination von Automated Machine Learning mit dem Domänenwissen des Anwenders führt zu den geeigneten Modellen für die jeweiligen Use-Cases. Mit dem Domänenwissen werden so die Zielsetzung und die zu berücksichtigenden Rahmenbedingungen gesetzt. Im Rahmen der automatischen Modellbildung werden eine Vielzahl an Kombinationen von Feature, ML-Verfahren und deren Hyperparameter gebildet, optimiert und validiert – und das immer vor dem Hintergrund der konkreten Anwendung. Das beste Modell ist letztendlich das mit der besten Performance hinsichtlich der von Nutzer gesetzten Zielgrößen.
Welchen konkreten Nutzwert können Machinen- und Anlagenbauer mit der Software Industrial AutoML generieren?
Zunächst einmal beschleunigt die Industrial AutoML-Software die Realisierung von ML-Lösungen um bis zu 80 Prozent. Das sind enorme Zeit- und auch Kostenvorteile. Bei Maschinenbauern lassen sich darüber hinaus merkliche Umsatz- und Margenvorteile mit neuen datenbasierten Services erzielen. Bei Maschinenbetreibern können Fertigungsprozesse optimiert werden, um zum Beispiel Produkteigenschaften zu verbessern, die Produktqualität sicherzustellen oder die Produktivität zu steigern.
















