Virtualisierung

Gregor Hansbuer | Lukas Dehling,

Kampf den redundanten Daten

Die Menge an Daten in den Unternehmen wächst. Mitverantwortlich sind redundante, sprich überflüssige Daten, die bei Kopiervorgängen entstehen. Eine effiziente Verwaltung mittels Copy-Data-Virtualisierung eliminiert das Problem.

© Activio

Digitalisierung und Vernetzung schreiten in der industriellen Fertigung voran. Dabei gilt es, Prozesse nicht nur in der Fertigung, sondern auch in der Entwicklung, Konstruktion und dem Service signifikant zu verbessern und zu beschleunigen – also während des gesamten Produktlebenszyklus.

Hierfür müssen große Datenmengen vorgehalten werden und während des Zyklus entstehen ständig neue – in allen Bereichen des Unternehmens: In sämtlichen Fertigungsprozessen inklusive Materialprüfungen und Qualitätssicherungsmaßnahmen, im gesamten Bereich der Logistik einschließlich Zulieferung, Lagerhaltung sowie Just-in-Time- und Just-in-Sequence-Prozessen sowie bei fertigen Produkten zum Beispiel in den Bereichen technischer Support und Serviceleistungen. Zudem ­sorgen zahlreiche Sensoren und Er­fassungssysteme, die in der Fertigungsindustrie zum Einsatz kommen, für nachhaltiges Datenwachstum. Neue ­­Anwendungsprogramme werden entwickelt, um die digi­talen Anforderungen zu er­füllen.

Bislang haben Unternehmen das Datenwachstum durch das Erhöhen von ­Speicherressourcen aufgefangen. Diese auf den ersten Blick logische Maß­nahme erweist sich jedoch ­langfristig als sehr kostenin­tensiv. Übersteigen die Speicherkosten irgendwann den Mehrwert aus dem Datenschatz, muss das Big-Data-Prinzip betriebswirtschaftlich in Frage gestellt werden. Vom Potenzial großer Datenmengen zu profitieren, ist aber nicht nur im Dienstleistungssektor angesagt, sondern gerade auch im produzierenden Gewerbe. Ein Zurück zu weniger Daten ist ebenso wenig denkbar, da hochautomatisierte Prozesse nun einmal mit einem hohen Datenvolumen verbunden sind.

Also geht es darum, die bestehenden und täglich neu hinzukommenden Daten möglichst kostengünstig und sicher zu speichern. Selbst neue effiziente Speichertechnologien wie SSD sind aber nicht in der Lage, ungebremstes Wachstum langfristig zu vertretbaren Kosten zu bewältigen. Wird das Datenvolumen in die Cloud übertragen, spart dies zwar  Investitionskosten für eigene Storage-Hardware im Rechenzentrum, doch das Pro­blem des ständig zunehmenden Volumens ist nur verlagert.

Hinzu kommt die Herausforderung, ­Daten besser verwertbar zu machen, um davon tatsächlich auch prozessübergreifend profitieren zu können. Die schnelle Analysemöglichkeit wird immer wichtiger. Große Mengen sollen also möglichst kostensparend gespeichert werden und einzelne Daten aus dem großen Pool flexibel und kurzfristig verfügbar sein.

Anzeige

Die Entstehung redundanter Daten

Die nächste Frage ist, ob bei den vielen Prozessen während des Lebenszyklus auch redundante, also eigentlich überflüssige Daten entstehen, die das Speichervolumen unnötig noch weiter aufblähen. Tatsächlich wächst der Datenberg wesentlich durch beabsichtigtes oder unbeabsichtigtes Kopieren. Ein Großteil der Daten, die sich in Unternehmen im Umlauf befinden, sind nur Abbildungen bereits vorhandener Daten.

Eine gewachsene Struktur im Rechenzentrum bestehend aus vielen Tools und Produkten für einzelne Anforderungen wie Datensicherung, Replikation, Deduplizierung sowie viele physische Kopien für Test und Entwicklungsumgebungen.

© Activio

Trotz Deduplizierung in konventionellen Speicherarchitekturen entstehen immer wieder Kopien für verschiedene Anwendungsfälle, die dann eben auchgespeichert werden. Der Anteil der Duplikate am gesamten Bestand ist in vielen Unternehmen weitaus ­höher als vermutet. Das Marktforschungs- und Beratungsunternehmen IDC schätzt, dass 60 % des in Rechenzentren gespeicherten Bestands mehrfache Duplikate derselben Daten oder ex­trem veraltete Kopien sind, sprich de facto nicht benötigter Datenmüll. Die Mehrzahl der gespeicherten Daten sind überzählige Kopien von Produktionsdaten, die unterschiedliche Anwendungen generieren. Die oftmals ungebremste Vervielfältigung von Kopien ist demzufolge zu einem großen Teil mitverantwortlich für das vielerorts enorme Datenwachstum. Daher wäre es sinnvoller, die ­bisherige Datenverwaltung zu hinter­fragen, bevor in Speicherressourcen – ­egal ob vor Ort oder in der Cloud – ­investiert wird.

Virtualisierung von Daten

Ein Ansatz, der noch nicht so weit verbreitet ist, sich in der Praxis aber bereits bewährt hat, ist das Copy-Data-Management. Das Konzept, das dahintersteckt, ist die Erstellung virtueller Kopien von Produktionsdaten. Dabei werden die Daten von ihrer zugrundeliegenden Infrastruktur entkoppelt, vergleichbar mit der Virtualisierung von Servern und Netzwerken, die bereits vor Jahren begann. Eine spezielle Datenmanagement-Plattform dient der Verwaltung der virtuellen Kopien. Bestandteil dieser Plattform sind bekannte Technologiewerkzeuge wie zum Beispiel Snapshots, Virtualisierung und Dedu-plizierung, die in einer einheitlichen Architektur zusammengefasst sind. Damit lassen sich unterschiedliche Anwendungsfälle (UseCases) vom klassischen Backup über Notfallbetrieb (Desaster Recovery) bis zu Test & Entwicklung von Anwendungsprogrammen abdecken. So können einzelne Datensilos abgeschafft werden.

Mit der Copy-Data-Virtualisierung vereinfacht sich die Architektur im Rechenzentrum, da viele Anwendungsfälle von der Daten­sicherung bis zur Bereitstellung von virtuellen Kopien für Test und Entwicklungssysteme mit einem Tool abgedeckt werden.

© Activio

Mit der Verwaltung virtueller Kopien sind vormals redundante Daten auf eine einzige physische Kopie reduziert. Der hier zugrundeliegende Prozess läuft folgendermaßen ab: Anwendungs- und Produktionsdaten werden in ihrem nativen Format, anhand definierter SLAs auf Blockebene erfasst. Die physische – auch als ‚goldene‘ Kopie bezeichnete – Masterkopie wird erstellt und gesichert. Geänderte Blöcke werden daraufhin stets inkrementell gespeichert. Von dieser physischen Masterkopie lassen sich bei Bedarf unzählige virtuelle Abbildungen erstellen, die unmittelbar für alle Anwendungsfälle zur Verfügung stehen, sei es für Analyse, Entwicklung, Datensicherung oder Tests. Auf diese Weise wird weitaus weniger Platz auf vorhandenen Servern und Speicherressourcen beansprucht, da nur jeweils eine physische Kopie Speicherplatz beansprucht. Die virtuellen Datenkopien stehen sofort zur Verfügung – ohne Investition in teure Speicherinfrastruktur. Die virtuellen Kopien benötigen kaum Speicherplatz, da nur die neuen Datenblöcke zur goldenen Kopie hinzugefügt werden, während ein Verpointierungssystem mit den einmaligen vorhandenen Datenblöcken eine Vollkopie für den Bedarfsfall vortäuscht.

Unternehmen in der Fertigungsindus-trie, die mit großem Datenwachstum konfrontiert sind, können von virtualisierter Datenverwaltung maßgeblich profitieren. Dies macht das folgende Beispiel deutlich: Große Mengen an von Fertigungsanlagen erzeugten Sen-sordaten werden in das eigene Rechenzentrum oder eine Cloud gesendet und dort gesammelt. Datenexperten können mittels kundenspezifischer Software diese Daten analysieren. Ziel ist es, Muster zu finden, um intelligente Entscheidungen für die Optimierung von Fertigungsprozessen zu treffen. Dafür müssen gegebenenfalls viele Personen oder Teams die Daten von mehreren Maschinen gleichzeitig analysieren – und das sehr schnell. Da in diesem Fall zahlreiche Kopien bestimmter Daten erstellt werden müssen, kann die Virtualisierung hier ihre Vorzüge ausspielen. Durch die Bereitstellung virtueller Kopien ist ein weitaus schnellerer Datenzugriff möglich als über herkömmliche Storage-Umgebungen.

Wertvolle Erkenntnisse ­gewinnen

Mit den inkrementellen Teilen der Daten, die von den Maschinen kommen, wird der Datenbestand immer wieder aufgefrischt, so dass für die Recherche stets aktuelle Daten zur Verfügung ­stehen. Ein solches Anwendungssze­nario ist heute bereits mit der Copy-Data-Virtualisierungstechnologie von Actifio in Kombination mit Oracle-Anwendungen und SQL-Datenbanken machbar. Bald soll es auch mit Datenbank-Architekturen wie NoSQL möglich sein.

Wenn es um Herausforderungen bei Storage und bei der Datenverwaltung für das Internet der Dinge und Indus-trie 4.0 geht, gibt es zweierlei Kostenfaktoren zu berücksichtigen: auf der ­einen Seite die offensichtlichen Kosten für Investitionen in Speicherressourcen und Systeme und auf der anderen ­Seite die indirekten Kosten, wenn es Unternehmen nicht gelingt, wichtige Erkenntnisse aus ihren Daten zu ziehen. Je mehr Daten, beispielsweise aus Sensoren von Maschinen, gesammelt und gespeichert werden, desto eher sind Analytiker in der Lage, ­daraus Erkenntnisse zu gewinnen. Sind allerdings die Kosten für die Speicherung und Verwaltung der IoT-Daten größer als der mögliche Nutzen, wird es ­problematisch. Damit die Gleichung aufgeht, sind moderne Ansätze wie ­virtualisiertes Copy-Data-Management erforderlich.

Indem Fertigungsunternehmen ihre Datenverwaltung konsolidieren und die Anzahl redundanter physischer Daten­kopien reduzieren, können sie sich fit ­machen für das Industrie-4.0-Zeitalter. Und sie bewältigen damit nicht nur das ­Datenwachstum, sondern pro­fitieren darüber hinaus auch von der effizienten Datenanalyse.

Autor: Gregor Hansbuer ist Sales Director für Actifio in der DACH-Region.

  • Xing Icon
  • LinkedIn Icon
Anzeige
Anzeige

Das könnte Sie auch interessieren

Anzeige

PTC

Verbindung von Design und Robotiksimulation

PTC bietet einen neuen Robotik-Workflow von der Konstruktion bis zur Simulation, der die Cloud-native CAD- und PDM-Plattform ‚Onshape‘ von PTC mit dem offenen Simulationsframework ‚Nvidia Isaac Sim‘ verbindet.

mehr...
Anzeige
Anzeige
Anzeige

Simus Systems

Zeichnungsinformationen für 3D-Modelle

Simus Systems hat die Software-Suite 'simus classmate' mit der KI-basierten Erfassung und Zuordnung von Zeichnungsinformationen für 3D-Modelle ergänzt. Nun gibt es das Modul ‚classmate Draw‘ als eigenständiges Produkt, womit laut Anbieter die...

mehr...
Anzeige
Anzeige
Anzeige
Jetzt Newsletter abonnieren