Cognex
Die goldene Mitte
Was tun mit Vision-Anwendungen, die einerseits zu komplex für die regelbasierte Bildverarbeitung sind, andererseits aber zu einfach, um die Investition in eine vollständige Deep Learning-Lösung zu rechtfertigen? Eine Möglichkeit ist maschinelles Lernen ‚an der Edge‘.
Die traditionelle industrielle Bildverarbeitung basiert auf analytischen, regelbasierten Algorithmen zur Erkennung und Parametrisierung von Fehlern, die mathematisch definiert werden können. Bei solchen Anwendungen bewerten hochqualifizierte Entwickler und Ingenieure jedes potenzielle Problem, wenden eine Reihe von Regeln an, mit denen die Aufgabe erfüllt werden kann, und programmieren dann das System. Um diesen Prozess zu vereinfachen, haben viele Anbieter Low-Code- und No-Code-Lösungen entwickelt, die die Abstimmung von Mustererkennungs-, Blob-, Kanten- oder anderen Vision-Tools auf die Anforderungen der Anwendung erleichtern. Aber: Die regelbasierte Bildverarbeitung stößt an ihre Grenzen, wenn Defekte numerisch schwer zu definieren sind oder ihr Aussehen stark variiert. Dies macht die ständige Weiterentwicklung und Pflege regelbasierter Bildverarbeitungsanwendungen, die aufgrund von Änderungen an Teilen und Verpackungen, neuen Komponenten und modifizierten Prozessen häufig unumgänglich ist, zu einer Herausforderung. Prozessänderungen ergeben sich zum Beispiel durch Rohmaterial- oder Komponentenvariationen verschiedener Lieferanten, durch technologische Fortschritte oder veränderte Lichtverhältnisse in der Produktionsumgebung.
Entwicklung von Deep Learning
Vor einem Jahrzehnt war Deep Learning, eine Unterkategorie des maschinellen Lernens und damit der Künstlichen Intelligenz, nur Unternehmen mit spezialisierten Fachleuten und großen Budgets vorbehalten. Fortschritte in der Theorie, bei der Computer-Hardware und der Datenverfügbarkeit haben jedoch dazu geführt, dass diese Technologie inzwischen auch in industriellen Bildverarbeitungsanwendungen zum Einsatz kommt. Deep Learning eignet sich insbesondere für zwei Bereiche:
- Situationen, in denen subjektive Entscheidungen getroffen werden müssen, wie zum Beispiel solche, die menschliche Inspektoren erfordern.
- Unübersichtliche Szenen, in denen die Identifizierung bestimmter Merkmale im Bild aufgrund der hohen Komplexität oder extremen Variabilität schwierig ist, beispielsweise bei starkem Hintergrundrauschen.
Im Gegensatz zum regelbasierten maschinellen Sehen, bei dem die Entwicklung neuer Algorithmen von Experten abhängt, basiert Deep Learning auf der Fähigkeit des Bedienpersonals, der Verantwortlichen für die Produktionsstraßen und anderer Fachleute, die Bilder als gut oder schlecht zu bewerten und die Art der in einem Bild vorhandenen Fehler zu klassifizieren. Dieser Ansatz macht hochqualifizierte Bildverarbeitungsspezialisten überflüssig und reduziert den Umfang des technischen Personals, das für die Bereitstellung und Wartung von Anwendungen erforderlich ist. Bei Änderungen lässt sich das Modell einfach neu trainieren, indem neue Bilder aufgenommen und gelabelt werden.
Herausforderungen bei Deep Learning
Mit Deep Learning-Toolkits können also KI-basierte Bildverarbeitungssysteme einfacher eingesetzt werden; es gibt aber immer noch Hindernisse. So erfordern die meisten erfolgreichen Deep Learning-Projekte nach wie vor große Budgets und spezielles Fachwissen von Vision-Ingenieuren und Datenspezialisten, um das System zunächst einzurichten. Nicht alle Projekte führen jedoch zu einer ausreichenden Effizienzsteigerung, um diese Investitionen zu rechtfertigen.
Wie bei jeder Vision-Anwendung spielt die Bilderfassungs-Hardware eine entscheidende Rolle für den Erfolg einer Deep Learning-Lösung. Für die Bilderfassung ist ein gut durchdachtes Bildgebungssystem erforderlich. Zuverlässige und wiederholbare Bildgebungsverfahren müssen in der Lage sein, Merkmale oder Objekte von Interesse klar zu unterscheiden. Die Darstellung der Teile, die Beleuchtungsmethoden und die Bildauflösung spielen eine wichtige Rolle bei der Erkennung der Feinheiten, die die Unterscheidung in verschiedene Klassifizierungen ermöglicht. Und die für die Bildanalyse verwendete Verarbeitung muss robust und leistungsfähig genug sein, um mit typischen Produktionsraten mitzuhalten und algorithmische Anforderungen zu erfüllen.
Auf der Software-Seite kann die Modellentwicklung viel Zeit in Anspruch nehmen und das Labeln von Hunderten oder Tausenden von Bildern erfordern. Darüber hinaus kann es schwierig sein, Bilder von defekten Objekten zu bekommen. Dies gilt insbesondere bei Prototyp-Produktionslinien, die nur eine geringe Anzahl von Teilen produzieren, sowie bei der Herstellung von Unterhaltungselektronik und mobilen Geräten, die häufig nur sehr kurze Produktionsläufe von einem Jahr oder weniger haben. Solche Situationen erfordern häufige Iterationen. Zudem produzieren hochautomatisierte Fertigungslinien in der Regel gute Teile mit wenigen Fehlern. Daher kann es mehrere Monate dauern, bis eine ausreichend große Stichprobe vorliegt, um ein zuverlässiges Modell zu erstellen.
Der Lückenschluss
Viele Anwendungen sind zu komplex für eine regelbasierte Bildverarbeitungslösung, rechtfertigen aber nicht die Zeit und die Ressourcen, die für die Entwicklung einer vollwertigen Deep Learning-Lösung erforderlich sind. Um diese Lücke in der Abdeckung von Vision-Anwendungen zwischen traditioneller regelbasierter und Deep Learning-basierter Bildverarbeitung zu schließen, haben Hardware-Hersteller Edge AI entwickelt, die auf den Software-Plattformen der Smart Kameras läuft.
Diese Art des Deep Learning, auch ‚Edge Learning‘ genannt, nutzt eine Sammlung bereits vorhandener Algorithmen, die das Modelltraining und die anschließende Bildanalyse direkt auf dem Gerät ermöglichen. Edge Learning ist ein maschineller Lernansatz, der speziell auf die industrielle Automatisierung zugeschnitten ist. Trainiert wird in zwei Schritten: Nach einem Vortrainieren erfolgt das Anlernen für spezifische Anwendungsfälle.
Der erste Schritt erfolgt durch den Edge Learning-Anbieter anhand eines großen Datensatzes, der für die industrielle Automatisierung optimiert ist. Das vorab trainierte Tool wird anschließend in eine Smart Kamera integriert und an den Kunden geliefert, der den zweiten Teil des Trainings für seinen spezifischen Anwendungsfall durchführt. Dieser Ansatz ermöglicht ein schnelleres Training, für das nur wenige Bilder benötigt werden, und erfordert weder einen Computer noch eine GPU. Das Einrichten und Erfassen von Bildern nimmt auch deshalb weniger Zeit in Anspruch, weil intelligente Kameras mehrere Elemente wie Sensor, Optik, Prozessor und manchmal sogar Beleuchtung kombinieren. Dieser Ansatz reduziert Probleme bei der Hardware-Integration, wie zum Beispiel die Verkabelung mit einem PC und die Einbindung der Inferenz-Engine.
Vorteile von Edge Learning
Edge Learning eignet sich insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, Montageprüfung und Zeichenlesen.
© CognexEdge Learning ist deutlich kostengünstiger als regelbasierte Bildverarbeitungs- und Deep Learning-Lösungen. Zudem benötigt es weniger Bilder und weniger Zeit zum Trainieren und Berechnen. So sind schnellere Produktionsanläufe und Produktumstellungen möglich, denn das Training des Systems und die Produktion finden am selben Ort statt.
Edge Learning eignet sich zwar nicht für hochkomplexe Aufgabenstellungen, kann aber einen großen Teil herkömmlicher Anwendungen mit deutlich geringerem Aufwand als beim Einsatz traditioneller Bildverarbeitungssysteme abdecken. Im Vergleich zu Deep Learning hat es eine viel kürzere Optimierungsschleife und macht es überflüssig, Bilder zum Labeln und zum erneuten Training an ein anderes Gerät zu senden. Es optimiert die Personalauslastung und reduziert den langfristigen Wartungsaufwand für die Erfassung und Verwaltung von Daten. Edge Learning setzt keine Kenntnisse im Bereich der industriellen Bildverarbeitung voraus; anstatt von Fachkräften abhängig zu sein, können Bedienpersonen und Verantwortliche von Produktionsstraßen Bilder selbst labeln und das System neu trainieren, wenn sich Teile oder Prozesse ändern. Durch die Möglichkeit für Nutzer jeden Levels, Inspektionsaufgaben schnell zu automatisieren, eignet sich Edge Learning für OEMs, Maschinenbauer und Endanwender gleichermaßen.
Der Autor Reto Wyss ist AI Vice President bei Cognex in Natick/Massachusetts/USA.















