Big Data
Maschinelles Lernen - der Einstieg!
Google, Facebook, Netflix und Amazon setzen bereits auf maschinelles Lernen. Auch im industriellen Umfeld sind die Möglichkeiten dieser Technologien in einem breiten Ausmaß möglich – doch die Unternehmen zögern. Dabei gilt es, keine Zeit zu verlieren.
Daten sind das Öl beziehungsweise der Rohstoff des 21. Jahrhunderts! Diese Aussage kusiert seit vielen Jahren durch die Automatisierungsbranche. Betrachtet man aber die Verbreitung von praktischen Data-Mining-Anwendungen oder -Applikationen mit integriertem maschinellem Lernen (Machine Learning) im Maschinen- und Anlagenbau, scheint der Ölrausch – zumindest in dieser Branche – bisher ausgeblieben zu sein. An fehlenden geeigneten Anwendungsfällen kann es dabei nicht liegen, da es vielfältige Optimierungs- und Vorhersage-Probleme bei der Entwicklung und dem Betrieb von Maschinen und Anlagen gibt.
Stellt sich somit die Frage, ob derart optimierte Produkte (noch) keine Kundenakzeptanz vorfinden, oder ob Unternehmen die Wirtschaftlichkeit solcher Lösungen in Frage stellen. Oder sind es schlicht handfeste Umsetzungs- und Organisationsthemen, die als Bremse wirken.
In der hardwaregetriebenen Branche hat die Software inklusive der Software-Entwicklung schon oft keinen leichten Stand. Die praktische Anwendung von Datenanalyse-Techniken und von maschinellem Lernen ist noch einmal ein weiterer Schritt aus der Komfortzone heraus. Diese zweiteilige Artikelserie soll helfen, grundlegende Fragen einer noch jungen Disziplin im Engineering zu beantworten.
Der Status quo
Als Ausgangspunkt dient die Frage: Wo stehen wir wirklich mit der Analysetechnologie? Diese Frage ist mit einem Blick auf den aktuellen Gartner Hype Zyklus 2016 aus der strategischen Perspektive zu beantworten: Machine Learning für spezifische Anwendungsfälle ist am ‚Peak of Inflated Expectations‘ oder übersetzt – am Gipfel der überzogenen Erwartungen angekommen. Dies bedeutet, dass sich die erste Aufbruchsphase zu dem Thema ihrem Ende zuneigt. Am Gipfel der überzogenen Erwartungen wird durch die große Beachtung, die das Thema erzeugt, so viel in das Thema hineinprojiziert, dass die Enttäuschung über Kinderkrankheiten in der Umsetzung und nicht erfüllbare Versprechen praktisch vorprogrammiert ist. Erst nach einer darauf folgenden Phase der Ernüchterung zeigt sich, ob sich die neue Technologie etabliert oder wieder verschwindet.
Welches Unternehmen nun jedoch glaubt, selbst erstmal abwarten zu können, um dann auf den Zug aufzuspringen, sollte sich nicht zu sicher sein. Die geschätzte Zeitspanne für die Etablierung von maschinellem Lernen beträgt laut Gartner nur noch zwei bis fünf Jahre. Demnach gilt es, keine Zeit zu verlieren und sich die Fragen im Hinblick auf einen konkreten Unternehmens- und Produkteinsatz zu beantworten, ohne dabei selbst ernüchtert zu werden.
Was ist konkret umsetzbar?
Bild 1: Die Projektschritte eines Analyseprojekts: Die Datenaufbereitung, die Modellierung mittels Data Mining und Machine Learning, die Interpretation der Zwischenergebnisse sowie die Bewertung und die Validierung der Modelle.
© Ingenieurbüro lean-digital-transformationMachine Learning ist eine Technologie, die zweifelsohne innovative und in der Anwendung hochoptimierte Produkte und Prozesse ermöglicht. Dies beweisen Firmen wie etwa Google, Facebook, Netflix oder Amazon. Deren Geschäftsmodelle und Produkte würden ohne Machine Learning schlichtweg nicht funktionieren. Ebenso kommen wir längst täglich in Kontakt mit Machine Learning und nutzen Funktionen wie zum Beispiel die Gesichtserkennung bei Fotos, der Bildersuche oder virtuelle Assistenten wie Siri und Cortana. Im industriellen Umfeld sind die Einsatzmöglichkeiten dieser Technologien ebenfalls in einem breiten Ausmaß möglich, allerdings noch nicht so konsequent umgesetzt beziehungsweise erst in der Umsetzungsphase. Generell werden zwei wesentliche Anwendungsfelder unterschieden: Knowledge Discovery und Predictive Analytics. Industrial Knowledge Discovery hat zum Ziel, kausale Wirkungszusammenhänge aus Daten zu erkennen (Bild 1), um daraus spezifische Maßnahmen abzuleiten.
Die wohl am häufigsten gestellten Fragen in diesem Zusammenhang sind solche wie: „Welche Prozessparameter führen zu einer hohen Qualität?“ Und: „Was ist die Ursache für die seit kurzem erhöhte Ausschussrate?“. Hier können etablierte, interpretierbare Methoden – wie etwa das Lernen und Analysieren von Entscheidungsbäumen und multivariaten Regressionsverfahren (mit integrierter Merkmalsauswahl) – eingesetzt werden. So konnte beispielsweise durch eine Kooperation von AMS Engineering und dem SCCH bei einem Laserschweißprozess als Ursache für nicht optimale Schweißnähte ein zu dicker Ölfilm-Rückstand am Ausgangsmaterial identifiziert werden. Wesentlich für den Erfolg beim Einsatz dieser Methoden ist die Integration der Fachexperten in den Knowledge-Discovery-Prozess.
Mit Machine-Learning-Methoden lässt sich zwar die Qualität der Modelle bewerten, nicht jedoch der Wert der gefundenen Zusammenhänge und des darin verborgenen Verbesserungspotenzials. So können Anwender einerseits sicherstellen, dass die Daten richtig vorbereitet und die Algorithmen korrekt darauf angewendet werden. Andererseits ist eine automatische Unterscheidung zwischen kausalen Zusammenhängen und oftmals irrelevanten statistischen Zusammenhängen sehr schwierig und es bedarf häufig manueller Eingriffe. Letzteres ist nach wie vor ein sehr aktives Forschungsgebiet und die bisher entwickelten Methoden sind für einen produktiven industriellen Einsatz noch nicht ausreichend stabil.
Vorhersagen generieren
Bild 2: Data Analytics kann auf allen Ebenen der Automatisierungspyramide vorkommen. Entsprechend sind verschiedene Gruppen von Know-how-Trägern einzubinden.
© Ingenieurbüro lean-digital-transformationÜber das reine Generieren von Wissen hinaus gehen Aufgabenstellung im Bereich Predictive Analytics. Deren Ziel ist es, Vorhersagemodelle für zukünftige Ereignisse zu generieren. Das Feld der industriellen Anwendung solcher Modelle ist sehr vielfältig. Es reicht von virtuellen Sensoren, der Fehlerdetektion, -diagnose und -vorhersage über die Vorhersage von kritischen Qualitäts-Attributen bis hin zur modelprädiktiven Kontrolle auf den unteren Ebenen der Automatisierungspyramide (Bild 2). Auf den oberen Ebenen der Pyramide dienen diese Verfahren zum Beispiel zur Unterstützung logistischer Prozesse oder zur besseren Vorhersage des Materialbedarfs und der erforderlichen Lagerhaltung. Das Spektrum der Methoden, die hier zum Einsatz kommen, ist sehr breit und umfasst bekannte Methoden des Machine Learnings wie neuronale Netzwerke und Support Vektor Machines und verwandte Methoden, die ihren Ursprung in Gebieten wie Systemidentifikation oder der Regelungstechnik haben. Besonders vielversprechend sind hybride Ansätze, in denen das Expertenwissen über das System und den Prozess als Basis für ein analytisches Modell dient, dessen potenzielle systematischen Unzulänglichkeiten sich mit einem datengetriebenen Ansatz korrigieren lassen.
94 % Genauigkeit
Beispielsweise wurde am Software Competence Center Hagenberg (SCCH) kürzlich erfolgreich ein neuronales Netzwerk zur Fehlervorhersage erstellt, welches mit 94-%iger Genauigkeit wesentliche Fehler von im Feld befindlichen Geräten vorhersagen kann. Dies ist im Vergleich mit der subjektiven Einschätzung des Servicepersonals oder einer starren Serviceplanung ein wesentlicher Vorteil, wodurch unmittelbar Geld und Zeit gespart werden kann.
Die verfügbaren Softwaretools zur Entwicklung solcher Anwendungen, lokal installierte Data-Mining-Suiten oder Cloud-basierte industrielle IoT-Plattformen, erleichtern heute schon die Anbindung kleiner bis sehr großer (Big Data) Datenquellen und die Kombination und Anwendung existierender Analytics Algorithmen wesentlich: Das Erstellen des oben angesprochenen neuronalen Netzwerkes zur Fehlervorhersage basierend auf wenigen Terabyte historischer Daten wurde auf einem leistungsstarken Desktop-PC durchgeführt, während sich jedoch das Lernen eines Fehlerdetektionsmodells für 100.000 im Feld befindlicher Geräte mit hunderten zeitlich hochaufgelösten Sensordaten nur noch mit einer entsprechenden Big-Data-Architektur bewerkstelligen lässt. Die Entwicklung des konkreten Modells beziehungsweise der Modell-Erstellungsablauf ist jedoch nach wie vor ein manueller, anspruchsvoller und oft längerer Prozess. Vor allem die Datenaufbereitung – das notwendige Fundament eines jeden erfolgreichen Analytics Projekts – ist aus Projektsicht ein wesentlicher Faktor. Hier fallen zwischen 50 % und manchmal sogar bis zu 80 % der Gesamtaufwände eines Analytics-Projekts an. Geht man die Analyse-Aufgabe dort mit falschen Erwartungen an, kann allein schon die Datenaufbereitung ein Stolperstein sein. Die automatisierte Datenaufbereitung ist – wie schon erwähnt – ein sehr aktives Forschungsgebiet und noch nicht für den produktiven industriellen Einsatz geeignet.
Den Nutzen bewerten
Mit dem Wissen allein, was technisch konkret umsetzbar wäre, ist es in vielen Fällen trotzdem noch sehr schwer, eine unternehmerische Entscheidung zu treffen. Die Fragen nach der Wirtschaftlichkeit oder das ungeklärte Marktpotenzial sind schnell sehr hohe Hürden – und der erste Schritt wird häufig nicht gemacht.
Um dennoch bei einem relativ niedrigen Informationsstand und hohem Entscheidungsrisiko starten zu können, gibt es Methoden zur Entscheidungsunterstützung. Eine Methode mit einem besonders hohen praktischen Nutzen ist die ‚Applied Information Economics‘, kurz AIE (Quelle: Hubbard, „How to measure anything“). Mit diesem Verfahren können potenzielle Anwender die zu erwartenden Einbußen und Gewinne ebenso pragmatisch abschätzen wie die Kosten, die zum Beispiel für eine Analyse, Schulung oder Beratung anfallen dürfen, um das Entscheidungsrisiko in einem angemessenen Rahmen zu verringern.
Die wesentliche Grundvoraussetzung für den erfolgreichen Einsatz dieses Verfahrens ist es, ein Gefühl für die eigene Unsicherheit zu bekommen und sich hier nicht selbst zu belügen. In der Fachsprache spricht man hier von kalibriertem Schätzen. Überprüfen sie unter folgender Homepage selbst Ihre Schätzungen an einem einfachen interaktiven Beispiel, ob Sie in die Entwicklung in ein Verfahren des maschinellen Lernens investieren sollten und was die Reduktion des Entscheidungsrisikos etwa durch ein Pilotprojekt oder ein Beratungsprojekt kosten dürfte: https://lean-dt.shinyapps.io/shinyDecisionSupport.
Autoren:
Dr.-Ing. Hans Egermeier ist selbstständiger Management Consultant mit dem Schwerpunkt Lean Digital Transformation;
Dr. Thomas Natschläger ist Scientific Head of Data Analysis Systems Group im Software Competence Center Hagenberg;
Markus Riedenbauer ist Projektleiter im Bereich Research & Development bei Siemens Transformers Austria.















