Kampf den redundanten Daten

Virtualisierung

Gregor Hansbuer | Lukas Dehling, 23.09.2015, 13:54

Kampf den redundanten Daten

Die Menge an Daten in den Unternehmen wächst. Mitverantwortlich sind redundante, sprich überflüssige Daten, die bei Kopiervorgängen entstehen. Eine effiziente Verwaltung mittels Copy-Data-Virtualisierung eliminiert das Problem.

Bilder

Digitalisierung und Vernetzung schreiten in der industriellen Fertigung voran. Dabei gilt es, Prozesse nicht nur in der Fertigung, sondern auch in der Entwicklung, Konstruktion und dem Service signifikant zu verbessern und zu beschleunigen – also während des gesamten Produktlebenszyklus.

Hierfür müssen große Datenmengen vorgehalten werden und während des Zyklus entstehen ständig neue – in allen Bereichen des Unternehmens: In sämtlichen Fertigungsprozessen inklusive Materialprüfungen und Qualitätssicherungsmaßnahmen, im gesamten Bereich der Logistik einschließlich Zulieferung, Lagerhaltung sowie Just-in-Time- und Just-in-Sequence-Prozessen sowie bei fertigen Produkten zum Beispiel in den Bereichen technischer Support und Serviceleistungen. Zudem sorgen zahlreiche Sensoren und Erfassungssysteme, die in der Fertigungsindustrie zum Einsatz kommen, für nachhaltiges Datenwachstum. Neue Anwendungsprogramme werden entwickelt, um die digitalen Anforderungen zu erfüllen.

Bislang haben Unternehmen das Datenwachstum durch das Erhöhen von Speicherressourcen aufgefangen. Diese auf den ersten Blick logische Maßnahme erweist sich jedoch langfristig als sehr kostenintensiv. Übersteigen die Speicherkosten irgendwann den Mehrwert aus dem Datenschatz, muss das Big-Data-Prinzip betriebswirtschaftlich in Frage gestellt werden. Vom Potenzial großer Datenmengen zu profitieren, ist aber nicht nur im Dienstleistungssektor angesagt, sondern gerade auch im produzierenden Gewerbe. Ein Zurück zu weniger Daten ist ebenso wenig denkbar, da hochautomatisierte Prozesse nun einmal mit einem hohen Datenvolumen verbunden sind.

Also geht es darum, die bestehenden und täglich neu hinzukommenden Daten möglichst kostengünstig und sicher zu speichern. Selbst neue effiziente Speichertechnologien wie SSD sind aber nicht in der Lage, ungebremstes Wachstum langfristig zu vertretbaren Kosten zu bewältigen. Wird das Datenvolumen in die Cloud übertragen, spart dies zwar Investitionskosten für eigene Storage-Hardware im Rechenzentrum, doch das Problem des ständig zunehmenden Volumens ist nur verlagert.

Hinzu kommt die Herausforderung, Daten besser verwertbar zu machen, um davon tatsächlich auch prozessübergreifend profitieren zu können. Die schnelle Analysemöglichkeit wird immer wichtiger. Große Mengen sollen also möglichst kostensparend gespeichert werden und einzelne Daten aus dem großen Pool flexibel und kurzfristig verfügbar sein.

Die Entstehung redundanter Daten

Die nächste Frage ist, ob bei den vielen Prozessen während des Lebenszyklus auch redundante, also eigentlich überflüssige Daten entstehen, die das Speichervolumen unnötig noch weiter aufblähen. Tatsächlich wächst der Datenberg wesentlich durch beabsichtigtes oder unbeabsichtigtes Kopieren. Ein Großteil der Daten, die sich in Unternehmen im Umlauf befinden, sind nur Abbildungen bereits vorhandener Daten.

Gewachsene Struktur im Rechenzentrum, Activio

Eine gewachsene Struktur im Rechenzentrum bestehend aus vielen Tools und Produkten für einzelne Anforderungen wie Datensicherung, Replikation, Deduplizierung sowie viele physische Kopien für Test und Entwicklungsumgebungen.

Trotz Deduplizierung in konventionellen Speicherarchitekturen entstehen immer wieder Kopien für verschiedene Anwendungsfälle, die dann eben auchgespeichert werden. Der Anteil der Duplikate am gesamten Bestand ist in vielen Unternehmen weitaus höher als vermutet. Das Marktforschungs- und Beratungsunternehmen IDC schätzt, dass 60 % des in Rechenzentren gespeicherten Bestands mehrfache Duplikate derselben Daten oder extrem veraltete Kopien sind, sprich de facto nicht benötigter Datenmüll. Die Mehrzahl der gespeicherten Daten sind überzählige Kopien von Produktionsdaten, die unterschiedliche Anwendungen generieren. Die oftmals ungebremste Vervielfältigung von Kopien ist demzufolge zu einem großen Teil mitverantwortlich für das vielerorts enorme Datenwachstum. Daher wäre es sinnvoller, die bisherige Datenverwaltung zu hinterfragen, bevor in Speicherressourcen – egal ob vor Ort oder in der Cloud – investiert wird.

Virtualisierung von Daten

Ein Ansatz, der noch nicht so weit verbreitet ist, sich in der Praxis aber bereits bewährt hat, ist das Copy-Data-Management. Das Konzept, das dahintersteckt, ist die Erstellung virtueller Kopien von Produktionsdaten. Dabei werden die Daten von ihrer zugrundeliegenden Infrastruktur entkoppelt, vergleichbar mit der Virtualisierung von Servern und Netzwerken, die bereits vor Jahren begann. Eine spezielle Datenmanagement-Plattform dient der Verwaltung der virtuellen Kopien. Bestandteil dieser Plattform sind bekannte Technologiewerkzeuge wie zum Beispiel Snapshots, Virtualisierung und Dedu-plizierung, die in einer einheitlichen Architektur zusammengefasst sind. Damit lassen sich unterschiedliche Anwendungsfälle (UseCases) vom klassischen Backup über Notfallbetrieb (Desaster Recovery) bis zu Test & Entwicklung von Anwendungsprogrammen abdecken. So können einzelne Datensilos abgeschafft werden.

Mit der Copy-Data-Virtualisierung vereinfacht sich die Architektur im Rechenzentrum, da viele Anwendungsfälle von der Datensicherung bis zur Bereitstellung von virtuellen Kopien für Test und Entwicklungssysteme mit einem Tool abgedeckt werden.

Mit der Verwaltung virtueller Kopien sind vormals redundante Daten auf eine einzige physische Kopie reduziert. Der hier zugrundeliegende Prozess läuft folgendermaßen ab: Anwendungs- und Produktionsdaten werden in ihrem nativen Format, anhand definierter SLAs auf Blockebene erfasst. Die physische – auch als ‚goldene‘ Kopie bezeichnete – Masterkopie wird erstellt und gesichert. Geänderte Blöcke werden daraufhin stets inkrementell gespeichert. Von dieser physischen Masterkopie lassen sich bei Bedarf unzählige virtuelle Abbildungen erstellen, die unmittelbar für alle Anwendungsfälle zur Verfügung stehen, sei es für Analyse, Entwicklung, Datensicherung oder Tests. Auf diese Weise wird weitaus weniger Platz auf vorhandenen Servern und Speicherressourcen beansprucht, da nur jeweils eine physische Kopie Speicherplatz beansprucht. Die virtuellen Datenkopien stehen sofort zur Verfügung – ohne Investition in teure Speicherinfrastruktur. Die virtuellen Kopien benötigen kaum Speicherplatz, da nur die neuen Datenblöcke zur goldenen Kopie hinzugefügt werden, während ein Verpointierungssystem mit den einmaligen vorhandenen Datenblöcken eine Vollkopie für den Bedarfsfall vortäuscht.

Unternehmen in der Fertigungsindus-trie, die mit großem Datenwachstum konfrontiert sind, können von virtualisierter Datenverwaltung maßgeblich profitieren. Dies macht das folgende Beispiel deutlich: Große Mengen an von Fertigungsanlagen erzeugten Sen-sordaten werden in das eigene Rechenzentrum oder eine Cloud gesendet und dort gesammelt. Datenexperten können mittels kundenspezifischer Software diese Daten analysieren. Ziel ist es, Muster zu finden, um intelligente Entscheidungen für die Optimierung von Fertigungsprozessen zu treffen. Dafür müssen gegebenenfalls viele Personen oder Teams die Daten von mehreren Maschinen gleichzeitig analysieren – und das sehr schnell. Da in diesem Fall zahlreiche Kopien bestimmter Daten erstellt werden müssen, kann die Virtualisierung hier ihre Vorzüge ausspielen. Durch die Bereitstellung virtueller Kopien ist ein weitaus schnellerer Datenzugriff möglich als über herkömmliche Storage-Umgebungen.

Wertvolle Erkenntnisse gewinnen

Mit den inkrementellen Teilen der Daten, die von den Maschinen kommen, wird der Datenbestand immer wieder aufgefrischt, so dass für die Recherche stets aktuelle Daten zur Verfügung stehen. Ein solches Anwendungsszenario ist heute bereits mit der Copy-Data-Virtualisierungstechnologie von Actifio in Kombination mit Oracle-Anwendungen und SQL-Datenbanken machbar. Bald soll es auch mit Datenbank-Architekturen wie NoSQL möglich sein.

Wenn es um Herausforderungen bei Storage und bei der Datenverwaltung für das Internet der Dinge und Indus-trie 4.0 geht, gibt es zweierlei Kostenfaktoren zu berücksichtigen: auf der einen Seite die offensichtlichen Kosten für Investitionen in Speicherressourcen und Systeme und auf der anderen Seite die indirekten Kosten, wenn es Unternehmen nicht gelingt, wichtige Erkenntnisse aus ihren Daten zu ziehen. Je mehr Daten, beispielsweise aus Sensoren von Maschinen, gesammelt und gespeichert werden, desto eher sind Analytiker in der Lage, daraus Erkenntnisse zu gewinnen. Sind allerdings die Kosten für die Speicherung und Verwaltung der IoT-Daten größer als der mögliche Nutzen, wird es problematisch. Damit die Gleichung aufgeht, sind moderne Ansätze wie virtualisiertes Copy-Data-Management erforderlich.

Indem Fertigungsunternehmen ihre Datenverwaltung konsolidieren und die Anzahl redundanter physischer Datenkopien reduzieren, können sie sich fit machen für das Industrie-4.0-Zeitalter. Und sie bewältigen damit nicht nur das Datenwachstum, sondern profitieren darüber hinaus auch von der effizienten Datenanalyse.

Autor: Gregor Hansbuer ist Sales Director für Actifio in der DACH-Region.

Das könnte Sie auch interessieren

PTC

Verbindung von Design und Robotiksimulation

PTC bietet einen neuen Robotik-Workflow von der Konstruktion bis zur Simulation, der die Cloud-native CAD- und PDM-Plattform ‚Onshape‘ von PTC mit dem offenen Simulationsframework ‚Nvidia Isaac Sim‘ verbindet.

mehr...

Virtual Components

Virtuelle Inbetriebnahme als Schlüssel zur Wettbewerbsfähigkeit

Virtuelle Inbetriebnahme wird in der Fertigung zum strategischen Erfolgsfaktor. Eine Studie von Visual Components zeigt, warum frühe Simulation Kosten senkt, Risiken minimiert und Wettbewerbsfähigkeit sichert.

mehr...

Interview mit Jeroen Buring, Dassault Systèmes

KI macht Ingenieure kreativer

Generative KI revolutioniert den Konstruktionsprozess. Statt mühsamer Routinearbeit entstehen in Sekunden tausende Designvarianten. Jeroen Buring erläutert, warum die Kombination aus KI, Simulation und Mensch die Zukunft der Industrie bestimmt.

mehr...

Bachmann electronic

Redundanz für die modellbasierte Entwicklung

Die Softwarelösung ‚M-Target for Simulink‘ von Bachmann electronic gibt es in einer neuen Version: Ein zentrales Highlight in ‚M-Target 2.75‘ ist die Hot-Standby-Redundanz, die kritische Anwendungen mit hohen Verfügbarkeitsanforderungen absichert.

mehr...

Quanteninnovation

Keysight beschleunigt Quantenforschung mit neuer Systemsimulation

Mit Quantum System Analysis stellt Keysight eine Simulationslösung auf Systemebene vor, die die Entwicklung supraleitender Quantensysteme revolutionieren soll. Die Software reduziert die Abhängigkeit von teuren kryogenen Tests und ermöglicht eine...

mehr...

Simus Systems

Zeichnungsinformationen für 3D-Modelle

Simus Systems hat die Software-Suite 'simus classmate' mit der KI-basierten Erfassung und Zuordnung von Zeichnungsinformationen für 3D-Modelle ergänzt. Nun gibt es das Modul ‚classmate Draw‘ als eigenständiges Produkt, womit laut Anbieter die...

mehr...

Software-Entkopplung im Maschinenbau

Zölle senken, Erlöse sichern

Zölle belasten Maschinenexporte. Wer weltweit liefert, muss bei steigenden Abgaben entscheiden: geringere Margen oder höhere Verkaufspreise. Beides schwächt die Wettbewerbsfähigkeit. Eine Möglichkeit, diese Belastung zu mindern, ist die Entkopplung...

mehr...

Hybride Inbetriebnahme

Inbetriebnahme 2.0: Virtuelle Modelle treffen reale Komponenten

Die hybride Inbetriebnahme (HIBN) verknüpft virtuelle Simulationen mit realen Komponenten und bietet eine flexible, effiziente Lösung für komplexe Produktionsanlagen.

mehr...

Das dynamische E-Paper

Die Screen Edition 2025/Q3: Eine neue Ära des digitalen Lesens

Stöbern Sie jetzt in der neuen ‚Screen Edition 2025/Q3´mit Updates für das dritte Quartal von Lenze, Siemens, Phoenix Contact, Mendix und Hy-Line sowie spannenden Artikeln aus den Bereichen All Electric Society, Antriebstechnik, Bildverarbeitung,...

mehr...