Crate.io
IoT-Projekte scheitern oft an den Daten
Das industrielle Internet-of-Things birgt gänzlich neue Möglichkeiten für produzierende Unternehmen im Hinblick auf Automation und Optimierung. Allerdings gibt es viele Gründe, warum neue Konzepte in der Praxis nicht den gewünschten Erfolg liefern.
Christian Lutz ist CEO und Co-Founder von Crate.io.
© Crate.ioSensoren, Geräte und Maschinen erzeugen in der vernetzten Fabrik heute massive Datenmengen in unterschiedlichsten Formaten. Abhängig von der Art der Produktion und dem Endprodukt stammen sie aus den Lagern für Rohstoffe und Zwischenerzeugnisse, werden von Maschinen und Fertigungsautomaten geliefert oder von Sensoren, die Gewichte, Abmessungen, Geschwindigkeiten oder andere physikalische Größen messen. Fließbänder melden kontinuierlich ihre Laufgeschwindigkeit, Qualitätssicherungssysteme erkennen Probleme oder Bildsyssteme speichern Fotos. Diese Informationen sind bezüglich Menge, Format, Protokoll oder Bedeutung höchst heterogen.
Aber damit nicht genug. Die Produktion von Gütern hat sich in den vergangenen Jahren grundlegend verändert. Die lokale Produktion komplexer Produkte wird zunehmend ersetzt durch weltweit verteilte Fertigungs-prozesse, weil Kriterien wie Personalkosten, Nähe zum Kunden oder auch die Verfügbarkeit von Know-how zu berücksichtigen sind. Selbst mittelständische Unternehmen betreiben nicht selten zehn und mehr Fabriken mit einigen Hundert Maschinen und einem hohen Aufkommen an Zeitreihendaten (Timeseries).
Diese in erster Linie betriebswirtschaftlichen und organisatorischen Entscheidungen müssen jedoch anschließend auch durch die IT abgebildet werden, und diese Zusammenführung aus operationalen Daten (oftmals SQL-Daten aus dem ERP) mit Timeseries-Daten (oftmals Sensor- oder Messdaten) ist ein wesentlicher Schlüssel.
Beachtliches Potenzial zur Prozessoptimierung
Diese Konstellation bietet ein enormes Potenzial für die Optimierung der Prozesse. Tatsächlich gehen allerdings einschlägige Marktbeobachter wie McKinsey oder Forbes davon aus, dass mehr als zwei Drittel der Projekte im Umfeld von IoT oder der digitalen Transformation nicht zum gewünschten (technischen und/oder wirtschaftlichen) Erfolg führen. Stellt sich die Frage nach den Gründen.
Entscheidend ist zunächst – wenig überraschend – die Verfügbarkeit der notwendigen Skills beziehungsweise des Know-hows. Dies ist, wie bei neuen Technologien nicht anders zu erwarten, eher begrenzt oder schwierig am Markt zu bekommen. Zum zweiten ist für eine erfolgreiche Umsetzung in der Regel eine Veränderung der Unternehmenskultur erforderlich: Change-Management und ein eher agiles Vorgehen müssen das überkommene Silo-Denken ersetzen, und das ist nicht ganz leicht. Der dritte und sehr bedeutsame Grund liegt jedoch in der Unzulänglichkeit der vorhandenen IT- und Dateninfrastruktur und dem Datenmanagement.
Überwindung konventioneller Restriktionen
Das wesentliche Rückgrat derartig komplexer Systeme bildet der Ansatz, für IoT-Daten einen zentralen, beliebig skalierbaren IoT-Daten-Pool zu schaffen, welcher in der Lage ist, massive Datenmengen von beliebig vielen Datenquellen zu erfassen, über eine Standard-SQL-Schnittstelle eine intelligente und schnelle Nutzung dieser Daten zu gewährleisten und eine unlimitierte Skalierung von (Roh-)Daten kosteneffizient zu erlauben. Denn mit der Speicherung alleine ist es nicht getan.
Der Verpackungshersteller Alpla nutzt ein industriefähiges Zeitreihenmanagement von Crate.
© Crate.ioGefordert ist ein System, das die anfallenden Informationen in Echtzeit und im Stream analysiert, aber auch gleichzeitig die historischen Daten-mengen kombinieren kann und in geeigneter Form bereitstellt.
Das führt zu neuen Anforderungen an die Architektur der zugrundeliegenden Datenbanken. Tatsächlich wurden konventionelle Datenbanken und Infrastrukturtechnologien nicht für die Welt der Maschinendaten in einem IoT-Maßstab entwickelt. In der Historie bestimmte die jeweilige Anwendungs-generation die notwendige Leistungsfähigkeit der IT.
In Zeiten lokal arbeitender ERP- oder MES-Systeme war die IT-Umgebung durch Mainframes, Client-/Server-Technologien und relationale SQL-Datenbanken definiert. Das Datenvolumen war eher begrenzt ebenso wie die Datenvarietät und die benötigte Geschwindigkeit. Es ging in erster Linie um die Sicherstellung der Datenkonsistenz, Zuverlässigkeit und Standardisierung.
Mit dem Aufkommen des Internets sowie der Cloud inklusive weiterer Anforderungen wie Mobile, Open-Source oder Big Data zeigten sich schnell die Performance-Schwächen dieses Ansatzes. Folgerichtig entstanden verteilte und dokumentenorientierte NoSQL-Datenbanken, die auch den Ansprüchen von Web-Scale-Architekturen gewachsen waren. Das Datenvolumen stieg kontinuierlich ebenso wie die Verarbeitungsgeschwindigkeit. Auch die Varietät der Daten nahm zu. Gefordert waren Systeme, die eine hohe Verfügbarkeit garantierten, ein schnelles und flexibles Development von Anwendungen ermöglichten und eine massive Zahl von Anwendern unterstützen konnten.
Das industrielle IoT mit seinen maschinengetriebenen Datenmengen läutete jedoch ein neues Level der digitalen Transformation ein. Neue Lösungen müssen heute nicht nur im Hinblick auf die Datenmengen performen, sondern es geht um die Kombination der traditionellen Datenwelten (Stichworte: SQL, ERP) mit Milliarden Datensätzen aus Sensoren und anderen IoT-Geräten, alles verknüpft aus unter Umständen weltweit verteilten Fabriken als Datenquellen, und mit enormen Skalierungsanforderungen.
Diese notwendige Flexibilität bei gleichzeitiger Kosteneffizienz erlaubt es, ganzheitliche Managementkonzepte zu unterstützen. Und das vor dem Hintergrund extremer Datenvolumina (von Terabyte zu Petabyte) und höchsten Anforderungen (Reaktion in Millisekunden) an die Geschwindigkeit bei einer hohen Varietät der zu bewältigenden Datenformate. Gefordert sind also Lösungen, die eine schnelle Datenerfassung und Echtzeit-Analyse ermöglichen, die einfach im Hinblick auf die wachsenden Zahl der Standorte und zu steuernden Maschinen skaliert werden können und die notwendige Flexibilität besitzen, um sowohl in der Cloud als auch lokal zu arbeiten.
Das Beste aus zwei Welten
Relationale Datenbanken wie SQL sind im Grunde Sammlungen zwei-dimensionaler Tabellen mit einer festen Struktur. Jede Zeile stellt einen Datensatz dar, der wiederum durch einen festen Index eindeutig identifizierbar ist. Die Anzahl der Spalten und der Dateityp müssen vor der Einspeisung definiert werden. Diese strengen Bestimmungen bringen diesen Datenbanktyp besonders bei großen Datenmengen und hoher paralleler Last an seine Grenzen. Auf der anderen Seite weisen SQL-fähige Datenbanken durchaus Vorzüge auf. Die liegen etwa in der breiten Verfügbarkeit des Know-hows zu deren Programmierung oder auch in der flexiblen Integration in bestehende Strukturen.
Mittels der Notes App und Reports in Echtzeit lässt sich der Produktionsprozess vor Ort optimieren.
© Crate.ioWas liegt also näher als eine Lösung, die das Beste aus zwei Welten verbindet?
Innovative Konzepte distribuierter Datenbanken wie die CrateDB über-winden die Restriktionen, indem sie den Komfort einer SQL-Datenbank mit der Flexibilität und Skalierbarkeit von NoSQL verbinden.
Die Vorteile sind bestechend: Sie können jeden strukturierten oder unstrukturierten Datentyp verarbeiten, Bilder und geospatiale Daten speichern, unlimitiert skalieren und trotzdem komplexe SQL-Queries in Real-Time bearbeiten. Das macht sowohl in funktionaler als auch in betriebs-wirtschaftlicher Hinsicht Sinn: Sie skalieren horizontal auf Clustern preiswerter Server, um sogar Millionen von Datensätzen pro Sekunde zu verarbeiten und das distributed Processing, die Datenpartitionierung auf Disk und spaltenförmige Indizes mit In-Memory-Performance ermöglichen Zeitreihen-Queries in Millisekunden, selbst wenn Hundertausende Clients Daten gleichzeitig abfragen und einfügen.
Die Verfügbarkeit, Skalierung und Ausfallsicherheit ist dabei aufgrund einer Shared-Nothing-Architektur jederzeit sichergestellt und ein Cluster kann beliebig nach oben oder unten gefahren werden. Auf dieser architektonischen Basis lassen sich heute IoT-Projekte realisieren, die im Vergleich zu konventionellen Datenbanken um ein Vielfaches schneller und wirtschaftlicher arbeiten. Aber mit der reinen Erfassung, Analyse und Speicherung der Daten ist es nicht getan. Die Datenbank ist letztlich nur ein Mittel zum Zweck, wenngleich auch ein entscheidendes.
Hochperformante Data-Ingestion und -Storage sind zwar Grundvoraus-setzung, benötigen aber Schnittstellen zu anderen Applikationen, um erstens die erfassten Daten mit anderen Informationen anzureichern und sie zweitens geeignet bereitzustellen. Das erfordert die entsprechenden Interfaces sowie Tools etwa für die Visualisierung der Informationen, deren Korrelation oder für die Erzeugung von Notifications bei entsprechend definierten Analyse-Ergebnissen.
Wirtschaftlichkeit und Funktionalität
Oft waren traditionelle Ansätze von SQL-Datenbanken (inklusive neuerer In-Memory-Systeme) mit der Speicherung von großen Datenmengen mit schneller Abfrage sofort preislich in einer Dimension angesiedelt, die den wirtschaftlichen Rahmen jedes IoT-Use-Cases gesprengt hat. Mit NoSQL-Systemen ist das ebenso häufig der Fall, auch weil neben der Cloud-Anforderungen spezielles Know-how dazu nötig ist. Die Kombination dieser Welten, auf Basis einer extrem optimierten Architektur, welche speziell für IoT Use-Cases entwickelt wurde, schafft hier die Lösung. Es kommt des Öfteren vor, dass beim Einsatz einer optimierten Datenbank eine 20- bis 30-mal schnellere Abfrage erzielt wird und gleichzeitig die entstehenden Cloud-Kosten um 50 bis 75 % günstiger ausfallen.
Das industrielle IoT mit seinen maschinengetriebenen Datenmengen läutet ein neues Level der digitalen Transformation ein.
© Crate.ioFür den wirtschaftlichen Einsatz und den reibungslosen Betrieb einer entsprech-end konfigurierten Datenmanagement-Lösung sind die Bereitstellung über die Cloud sowie eine 24/7-Betreuung von herausragender Bedeutung. Der Betrieb eigener Rechenzentren inklusive massiver Investitionen in die Infra-struktur sowie die Maintenance einer unternehmenskritischen Anwendung durch eigene Mitarbeiter mit den erforderlichen Skills ist für die meisten Unternehmen kaum mehr zu leisten. Entsprechend müssen Lösungen, die den Anforderungen an das IoT gewachsen sind, als Managed-Cloud-Solution verfügbar sein, trotzdem aber die Option für den Edge-Einsatz bieten, überall dort, wo die Gegebenheiten den Cloud-Betrieb nicht zulassen.
Der Einsatz einer Cloud-basierten und gemanagten Datenplattform, die für die Bewältigung der komplexen Anforderungen in einer maschinengetriebenen Umgebung entwickelt und optimiert ist, kann in vielfältiger Weise dazu beitragen, innovative IoT-Projekte zu einem positiven Ergebnis zu führen. Sie stellt das Handling der Daten umfänglich sicher, inklusive der Möglichkeit, leicht den Anforderungen entsprechend zu wachsen. Und sie lindert das Know-how-Problem, indem der Fokus darauf liegt, IoT- und Maschinendaten intelligent zu nutzen, anstatt die Datenbank zu verwalten. Mit den belegbaren Vorteilen im Hinblick auf Effizienz, Wirtschaftlichkeit und Verbesserung der Prozesse liefert sie die notwendigen Argumente für die Akzeptanz im Unternehmen.
















