Die goldene Mitte

Cognex

Reto Wyss | Inka Krischke, 12.06.2024, 17:00

Die goldene Mitte

Was tun mit Vision-Anwendungen, die einerseits zu komplex für die regelbasierte Bildverarbeitung sind, andererseits aber zu einfach, um die Investition in eine vollständige Deep Learning-Lösung zu rechtfertigen? Eine Möglichkeit ist maschinelles Lernen ‚an der Edge‘.

Bilder

Die traditionelle industrielle Bildverarbeitung basiert auf analytischen, regelbasierten Algorithmen zur Erkennung und Parametrisierung von Fehlern, die mathematisch definiert werden können. Bei solchen Anwendungen bewerten hochqualifizierte Entwickler und Ingenieure jedes potenzielle Problem, wenden eine Reihe von Regeln an, mit denen die Aufgabe erfüllt werden kann, und programmieren dann das System. Um diesen Prozess zu vereinfachen, haben viele Anbieter Low-Code- und No-Code-Lösungen entwickelt, die die Abstimmung von Mustererkennungs-, Blob-, Kanten- oder anderen Vision-Tools auf die Anforderungen der Anwendung erleichtern. Aber: Die regelbasierte Bildverarbeitung stößt an ihre Grenzen, wenn Defekte numerisch schwer zu definieren sind oder ihr Aussehen stark variiert. Dies macht die ständige Weiterentwicklung und Pflege regelbasierter Bildverarbeitungsanwendungen, die aufgrund von Änderungen an Teilen und Verpackungen, neuen Komponenten und modifizierten Prozessen häufig unumgänglich ist, zu einer Herausforderung. Prozessänderungen ergeben sich zum Beispiel durch Rohmaterial- oder Komponentenvariationen verschiedener Lieferanten, durch technologische Fortschritte oder veränderte Lichtverhältnisse in der Produktionsumgebung.

Entwicklung von Deep Learning

Vor einem Jahrzehnt war Deep Learning, eine Unterkategorie des maschinellen Lernens und damit der Künstlichen Intelligenz, nur Unternehmen mit spezialisierten Fachleuten und großen Budgets vorbehalten. Fortschritte in der Theorie, bei der Computer-Hardware und der Datenverfügbarkeit haben jedoch dazu geführt, dass diese Technologie inzwischen auch in industriellen Bildverarbeitungsanwendungen zum Einsatz kommt. Deep Learning eignet sich insbesondere für zwei Bereiche:

Situationen, in denen subjektive Entscheidungen getroffen werden müssen, wie zum Beispiel solche, die menschliche Inspektoren erfordern.
Unübersichtliche Szenen, in denen die Identifizierung bestimmter Merkmale im Bild aufgrund der hohen Komplexität oder extremen Variabilität schwierig ist, beispielsweise bei starkem Hintergrundrauschen.

Im Gegensatz zum regelbasierten maschinellen Sehen, bei dem die Entwicklung neuer Algorithmen von Experten abhängt, basiert Deep Learning auf der Fähigkeit des Bedienpersonals, der Verantwortlichen für die Produktionsstraßen und anderer Fachleute, die Bilder als gut oder schlecht zu bewerten und die Art der in einem Bild vorhandenen Fehler zu klassifizieren. Dieser Ansatz macht hochqualifizierte Bildverarbeitungsspezialisten überflüssig und reduziert den Umfang des technischen Personals, das für die Bereitstellung und Wartung von Anwendungen erforderlich ist. Bei Änderungen lässt sich das Modell einfach neu trainieren, indem neue Bilder aufgenommen und gelabelt werden.

Herausforderungen bei Deep Learning

Mit Deep Learning-Toolkits können also KI-basierte Bildverarbeitungssysteme einfacher eingesetzt werden; es gibt aber immer noch Hindernisse. So erfordern die meisten erfolgreichen Deep Learning-Projekte nach wie vor große Budgets und spezielles Fachwissen von Vision-Ingenieuren und Datenspezialisten, um das System zunächst einzurichten. Nicht alle Projekte führen jedoch zu einer ausreichenden Effizienzsteigerung, um diese Investitionen zu rechtfertigen.

Wie bei jeder Vision-Anwendung spielt die Bilderfassungs-Hardware eine entscheidende Rolle für den Erfolg einer Deep Learning-Lösung. Für die Bilderfassung ist ein gut durchdachtes Bildgebungssystem erforderlich. Zuverlässige und wiederholbare Bildgebungsverfahren müssen in der Lage sein, Merkmale oder Objekte von Interesse klar zu unterscheiden. Die Darstellung der Teile, die Beleuchtungsmethoden und die Bildauflösung spielen eine wichtige Rolle bei der Erkennung der Feinheiten, die die Unterscheidung in verschiedene Klassifizierungen ermöglicht. Und die für die Bildanalyse verwendete Verarbeitung muss robust und leistungsfähig genug sein, um mit typischen Produktionsraten mitzuhalten und algorithmische Anforderungen zu erfüllen.

Auf der Software-Seite kann die Modellentwicklung viel Zeit in Anspruch nehmen und das Labeln von Hunderten oder Tausenden von Bildern erfordern. Darüber hinaus kann es schwierig sein, Bilder von defekten Objekten zu bekommen. Dies gilt insbesondere bei Prototyp-Produktionslinien, die nur eine geringe Anzahl von Teilen produzieren, sowie bei der Herstellung von Unterhaltungselektronik und mobilen Geräten, die häufig nur sehr kurze Produktionsläufe von einem Jahr oder weniger haben. Solche Situationen erfordern häufige Iterationen. Zudem produzieren hochautomatisierte Fertigungslinien in der Regel gute Teile mit wenigen Fehlern. Daher kann es mehrere Monate dauern, bis eine ausreichend große Stichprobe vorliegt, um ein zuverlässiges Modell zu erstellen.

Der Lückenschluss

Viele Anwendungen sind zu komplex für eine regelbasierte Bildverarbeitungslösung, rechtfertigen aber nicht die Zeit und die Ressourcen, die für die Entwicklung einer vollwertigen Deep Learning-Lösung erforderlich sind. Um diese Lücke in der Abdeckung von Vision-Anwendungen zwischen traditioneller regelbasierter und Deep Learning-basierter Bildverarbeitung zu schließen, haben Hardware-Hersteller Edge AI entwickelt, die auf den Software-Plattformen der Smart Kameras läuft.

Diese Art des Deep Learning, auch ‚Edge Learning‘ genannt, nutzt eine Sammlung bereits vorhandener Algorithmen, die das Modelltraining und die anschließende Bildanalyse direkt auf dem Gerät ermöglichen. Edge Learning ist ein maschineller Lernansatz, der speziell auf die industrielle Automatisierung zugeschnitten ist. Trainiert wird in zwei Schritten: Nach einem Vortrainieren erfolgt das Anlernen für spezifische Anwendungsfälle.

Der erste Schritt erfolgt durch den Edge Learning-Anbieter anhand eines großen Datensatzes, der für die industrielle Automatisierung optimiert ist. Das vorab trainierte Tool wird anschließend in eine Smart Kamera integriert und an den Kunden geliefert, der den zweiten Teil des Trainings für seinen spezifischen Anwendungsfall durchführt. Dieser Ansatz ermöglicht ein schnelleres Training, für das nur wenige Bilder benötigt werden, und erfordert weder einen Computer noch eine GPU. Das Einrichten und Erfassen von Bildern nimmt auch deshalb weniger Zeit in Anspruch, weil intelligente Kameras mehrere Elemente wie Sensor, Optik, Prozessor und manchmal sogar Beleuchtung kombinieren. Dieser Ansatz reduziert Probleme bei der Hardware-Integration, wie zum Beispiel die Verkabelung mit einem PC und die Einbindung der Inferenz-Engine.

Vorteile von Edge Learning

Edge Learning eignet sich insbesondere für Aufgabenstellungen in den Bereichen Klassifizierung, Montageprüfung und Zeichenlesen.

Edge Learning ist deutlich kostengünstiger als regelbasierte Bildverarbeitungs- und Deep Learning-Lösungen. Zudem benötigt es weniger Bilder und weniger Zeit zum Trainieren und Berechnen. So sind schnellere Produktionsanläufe und Produktumstellungen möglich, denn das Training des Systems und die Produktion finden am selben Ort statt.

Edge Learning eignet sich zwar nicht für hochkomplexe Aufgabenstellungen, kann aber einen großen Teil herkömmlicher Anwendungen mit deutlich geringerem Aufwand als beim Einsatz traditioneller Bildverarbeitungssysteme abdecken. Im Vergleich zu Deep Learning hat es eine viel kürzere Optimierungsschleife und macht es überflüssig, Bilder zum Labeln und zum erneuten Training an ein anderes Gerät zu senden. Es optimiert die Personalauslastung und reduziert den langfristigen Wartungsaufwand für die Erfassung und Verwaltung von Daten. Edge Learning setzt keine Kenntnisse im Bereich der industriellen Bildverarbeitung voraus; anstatt von Fachkräften abhängig zu sein, können Bedienpersonen und Verantwortliche von Produktionsstraßen Bilder selbst labeln und das System neu trainieren, wenn sich Teile oder Prozesse ändern. Durch die Möglichkeit für Nutzer jeden Levels, Inspektionsaufgaben schnell zu automatisieren, eignet sich Edge Learning für OEMs, Maschinenbauer und Endanwender gleichermaßen.

Reto Wyss, Cognex

Der Autor Reto Wyss ist AI Vice President bei Cognex in Natick/Massachusetts/USA.

zurück zur Themenseite

Das könnte Sie auch interessieren

MVTec auf der Hannover Messe

Machine-Vision-Einsatz in der Industrie

MVTec präsentiert auf der Hannover Messe die aktuellen Versionen von MVTec Halcon und MVTec Merlic. Produkt-Demos veranschaulichen den Machine-Vision-Einsatz in der Industrie.

mehr...

Cognex

Elektrofahrzeuge effizient produzieren

Elektrofahrzeuge erfordern vor allem für die Fertigung ihrer Batterie spezielle Prozesse bei der Qualitätsprüfung. Hier verrichten Bildverarbeitungssysteme auf Basis künstlicher Intelligenz ihre Arbeit.

mehr...

VDI

Fachkonferenz „Machine Vision“ in Baden-Baden

Die VDI-Fachkonferenz „Machine Vision – Von der Inspektion zur smarten Revolution“ am 17./18. Juni 2026 in Baden-Baden vermittelt einen umfassenden praxisbezogenen Einblick in aktuelle Anwendungen des maschinellen Sehens. Einen Schwerpunkt bildet...

mehr...

Teledyne Dalsa

SWIR-Hyperspektralkamera für industrielle Hochgeschwindigkeitsinspektion

Teledyne Dalsa bringt mit 'Kaleido' eine Hyperspektralkamera für den Einsatz im kurzwelligen Infrarotbereich (SWIR) auf den Markt, die dazu entwickelt wurde, um die existierenden Integrations- und Leistungsgrenzen industrieller Sortierprozesse zu...

mehr...

IDS

ToF-Kamera für präzise 3D-Daten in jeder Umgebung

IDS Imaging Development Systems erweitert mit 'Nion', einer industriellen ToF Kamera mit 1,2 Megapixel Auflösung und integrierter Tiefenverarbeitung, das 3D Portfolio.

mehr...

VDMA Robotik + Automation

Bildverarbeitungsbranche erwartet Trendwende in 2026

Nach schwierigen Jahren sendet die europäische Bildverarbeitungsindustrie erste Erholungssignale: Für 2026 wird wieder Wachstum erwartet – getragen von globaler Nachfrage, KI und Automatisierung. Doch Unsicherheiten und schwache Investitionen in...

mehr...

Pepperl+Fuchs auf der Hannover Messe 2026

Industrielle Ereigniskamera

Die Ereigniskamera 'VOC' von Pepperl+Fuchs bietet eine 24/7-Liveansicht der Anwendung. In einem Ringpuffer hält sie jeweils die letzten 900 s der durchlaufenden Videoaufnahme fest.

mehr...

3D-Vision

Basler und Orbbec starten Technologiepartnerschaft

Basler, Anbieter von Machine Vision-Komponenten und -Lösungen, und Orbbec, Spezialist für 3D Vision-Technologie und Robotik, haben eine strategische Partnerschaft zur Umsetzung industrieller 3D-Lösungen für die Fabrik- und Logistikautomation bekannt...

mehr...

Messe München

automatica findet 2027 erstmals in China statt

Die automatica erweitert ihre globale Markenstrategie und wird 2027 erstmals in China stattfinden. Die automatica Shanghai 2027, organisiert von der Messe München Shanghai und der VDMA-Repräsentanz in Shanghai, feiert vom 8. bis 10. März 2027 im...

mehr...

Die goldene Mitte

Entwicklung von Deep Learning

Unsichere Zeiten für Machine Vision

Bildverarbeitung – Die Gewinner

Dezentral für die Lagerlogistik

Herausforderungen bei Deep Learning

Der Lückenschluss

Vorteile von Edge Learning

Das könnte Sie auch interessieren

Machine-Vision-Einsatz in der Industrie

Elektrofahrzeuge effizient produzieren

Fachkonferenz „Machine Vision“ in Baden-Baden

SWIR-Hyperspektralkamera für industrielle Hochgeschwindigkeitsinspektion

ToF-Kamera für präzise 3D-Daten in jeder Umgebung

Bildverarbeitungsbranche erwartet Trendwende in 2026

Industrielle Ereigniskamera

Basler und Orbbec starten Technologiepartnerschaft

automatica findet 2027 erstmals in China statt

Rubriken

Schwerpunkte

Service

Magazin

Unser Netzwerk