MVTec
Das ‚Auge der Produktion‘
Industrielle Bildverarbeitung trägt maßgeblich dazu bei, Produktionsketten durchgängig zu automatisieren und zu optimieren. Werden hierbei Verfahren der künstlichen Intelligenz wie Deep Learning eingesetzt, lässt sich die Prozesseffizienz weiter steigern.
Bei der durchgängigen Automatisierung von Wertschöpfungsketten in Produktionsunternehmen spielt die industrielle Bildverarbeitung eine bedeutsame Rolle. Ganz im Sinne von Industrie 4.0 fungiert Machine Vision als wichtige Begleittechnologie und bildet quasi das ‚Auge der Produktion‘. An verschiedenen Stellen positionierte Bildeinzugsgeräte wie Kameras, Scanner oder 3D-Sensoren haben die Fertigungs- und Intralogistik-Prozesse kontinuierlich im Blick. Die aufgenommenen, digitalen Bilddaten werden gesammelt und mittels einer integrierten Machine-Vision-Software verarbeitet. So lassen sie sich für vielfältige Anwendungen nutzen, was den gesamten Produktionsablauf optimiert.
Beispielsweise werden unterschiedlichste Objekte aufgrund ihres optischen Erscheinungsbildes sicher erkannt und zugeordnet. Gefertigte Produkte lassen sich auf diese Weise entlang der gesamten Prozesskette identifizieren und nachverfolgen – sowohl anhand äußerer Merkmale als auch durch aufgedruckte Datacodes oder Zeichenkombinationen. Zudem lässt sich das komplette Handling von Objekten optimieren und automatisieren: Werkstücke werden präzise lokalisiert und für die Bearbeitung optimal positioniert. Roboter können Gegenstände exakt erkennen und gezielt greifen. Und auch die Interaktion zwischen Maschinen und Menschen wird sicherer und effizienter, indem sich gefährliche Kollisionen zwischen den Akteuren durch die lückenlose Machine-Vision-Überwachung vermeiden lassen.
Hohe Fehlererkennungsraten dank KI
Ein weiteres wichtiges Anwendungsfeld der industriellen Bildverarbeitung ist die Fehlerinspektion. Die Technologie ist in der Lage, Defekte aller Art durch einen Vergleich zwischen Ist- und Sollzustand verlässlich aufzuspüren. Fehlerhafte Waren lassen sich dann zielsicher und automatisiert aussortieren, was die Ausschuss-Produktion minimiert. So trägt industrielle Bildverarbeitung dazu bei, die Qualitätssicherung auf eine neue Stufe zu stellen. Dies kommt noch mehr zum Tragen, werden dabei Verfahren auf Basis künstlicher Intelligenz (KI) eingesetzt. In Betracht kommt hier insbesondere Deep Learning, das auf Convolutional Neural Networks (CNNs) beruht. Werden entsprechende Algorithmen in die Machine-Vision-Software integriert, lassen sich noch höhere Fehlererkennungsraten erzielen.
Deep Learning nutzt große Mengen an digitalen Bildinformationen, die von den Bildeinzugsgeräten generiert werden. Die Technologie analysiert die Daten fundiert im Rahmen eines umfassenden Trainings. In diesem lernt die Software besondere Eigenschaften, die typisch für eine spezielle Objektklasse sind. Dadurch lassen sich die Bilddaten dann exakt einer bestimmten Klasse zuweisen. Dies ermöglicht die automatische Klassifizierung von Objekten und Defekten, die auf den Bildern zu sehen sind. Auf diese Weise verbessert sich die Erkennung sowie Lokalisierung der Gegenstände und Fehler deutlich.
Neben KI-basierten Lösungen können für Inspektionsaufgaben auch regelbasierte Systeme herangezogen werden. Letztere erfordern jedoch eine sehr aufwendige Programmierung. So müssen Entwickler manuell Regeln definieren, um die maßgeblichen Informationen für die Defekt-Erkennung aus den Bilddaten zu extrahieren. Ist mit einer unüberschaubar großen Menge möglicher Fehler zu rechnen, sprengt die Entwicklung einer regelbasierten Lösung oft schnell den Aufwand. Daher sind KI-Technologien wie Deep Learning in solchen Fällen die bessere Wahl. Die Algorithmen lernen durch das Training eigenständig dazu, identifizieren relevante Merkmale automatisiert und können dadurch einzelne Objektklassen eindeutig voneinander unterscheiden. So lässt sich eine Vielzahl heterogener Fehler effektiver erkennen.
Trainingsvorbereitung in mehreren Schritten
Mit Deep Learning lassen sich sowohl ‚Schlecht-Bilder‘ als auch ‚Gut-Bilder‘ für die Fehlerinspektion nutzen.
© MVTec SoftwareDoch auch der Einsatz von Deep-Learning-Methoden verursacht einen gewissen Aufwand. So muss das Training gut vorbereitet werden: Hierfür ist es im ersten Schritt erforderlich, die relevanten Bilddaten zu generieren, zu sammeln und bereitzustellen. Auf diesen müssen die Objekte mit den zu erkennenden Fehlern zu sehen sein (sogenannte ‚Schlecht-Bilder‘). Im Anschluss werden die Bilder gelabelt. Das bedeutet, sie erhalten ein digitales Etikett, durch das sie sich klar in eine spezifische Objekt- oder Fehlerklasse einordnen lassen. Dabei kann ein Label beispielsweise als ‚Sprung‘, ‚Riss‘ oder ‚Kerbe‘ definiert sein. Erst dann wird das zugrundeliegende CNN mit den ausgewählten Bildern trainiert.
Um den Deep-Learning-Aufwand zu verringern, stellen einige Anbieter bereits vortrainierte Netze zur Verfügung. In moderner Machine-Vision-Standardsoftware wie etwa ‚Halcon‘ von MVTec sind entsprechende Funktionen schon enthalten. Die integrierten Deep-Learning-Netze wurden mit einer enormen Anzahl an Bildern vortrainiert. Diese vortrainierten Netze sind auf Anwendungen im industriellen Umfeld optimiert und frei von Rechten Dritter, was lizenzrechtliche Bedenken ausschließt. So benötigen Anwender nur noch wenige Bilder für das anwendungsspezifische Training und sparen Zeit, Aufwand und Kosten. Auf diese Weise können Unternehmen die Rentabilität ihrer Deep-Learning-basierten Inspektionsprozesse steigern.
Die Herausforderung: ausreichend ‚Schlecht-Bilder‘ generieren
Der Erkennungsprozess mittels KI besteht aus dem eigentlichen Training und der Ausführung des Prüfvorgangs (Inferenz).
© MVTec SoftwareEin gewisser Restaufwand für das Labeln der eigenen Bilder verbleibt dennoch. Je nach individueller Anwendung werden mindestens 150 bis 300 Trainingsbilder pro Defekttyp benötigt. Dabei handelt es sich um ‚Schlecht-Bilder‘, also solche, die die entsprechenden Objekte mit den zu erkennenden Defekten in verschiedenen Erscheinungsformen zeigen. In den meisten Fällen haben Unternehmen aber eine so große Anzahl an ‚Schlecht-Bildern‘ gar nicht zur Verfügung. Hinzu kommt, dass die möglichen Defekte und Fehlerquellen in ihrer konkreten Ausprägung im Vorfeld meist nicht bekannt sind. Aufgrund dieser Ungewissheit wären also die Beschaffung und das Labeling entsprechender Bilder mit unverhältnismäßig hohem Aufwand verbunden, der für Unternehmen in der Regel nicht rentabel ist.
Eine praktikable Lösung hierfür bietet eine Technologie, die Bestandteil der Machine-Vision-Standardsoftware ‚MVTec Halcon‘ ist: Das Feature ‚Anomaly Detection‘ benötigt nur sogenannte ‚Gut-Bilder‘, die das jeweilige Objekt in einwandfreiem Zustand abbilden. Daher sind sie wesentlich einfacher zu erstellen als ‚Schlecht-Bilder‘. Zudem müssen die Trainingsdaten nicht explizit gelabelt werden, da ja keine Defekte auf den Bildern zu sehen sind. 20 bis maximal 100 Trainingsbilder reichen aus, um robuste Erkennungsraten zu erzielen. Mit der Version ‚MVTec Halcon 20.05‘ dauerte das Training in Testreihen mit 20 Bildern nur etwa sechs Minuten.
Mario Bohnacker ist Technical Product Manager Halcon bei MVTec Software in München.
© MVTec SoftwareIst das Training abgeschlossen, erstellt das System während der Ausführung des Prüfschrittes (Inferenz) eine sogenannte ‚Anomaly Map‘. Darin werden anhand eines Grauwerts bestimmte Regionen hervorgehoben, in denen mit hoher Wahrscheinlichkeit eine Anomalie vorliegt. Durch diese Segmentierung können Abweichungen dann pixelgenau erkannt, lokalisiert und in der Größe bestimmt werden.

















