Virtualisierung
Kampf den redundanten Daten
Die Menge an Daten in den Unternehmen wächst. Mitverantwortlich sind redundante, sprich überflüssige Daten, die bei Kopiervorgängen entstehen. Eine effiziente Verwaltung mittels Copy-Data-Virtualisierung eliminiert das Problem.
Digitalisierung und Vernetzung schreiten in der industriellen Fertigung voran. Dabei gilt es, Prozesse nicht nur in der Fertigung, sondern auch in der Entwicklung, Konstruktion und dem Service signifikant zu verbessern und zu beschleunigen – also während des gesamten Produktlebenszyklus.
Hierfür müssen große Datenmengen vorgehalten werden und während des Zyklus entstehen ständig neue – in allen Bereichen des Unternehmens: In sämtlichen Fertigungsprozessen inklusive Materialprüfungen und Qualitätssicherungsmaßnahmen, im gesamten Bereich der Logistik einschließlich Zulieferung, Lagerhaltung sowie Just-in-Time- und Just-in-Sequence-Prozessen sowie bei fertigen Produkten zum Beispiel in den Bereichen technischer Support und Serviceleistungen. Zudem sorgen zahlreiche Sensoren und Erfassungssysteme, die in der Fertigungsindustrie zum Einsatz kommen, für nachhaltiges Datenwachstum. Neue Anwendungsprogramme werden entwickelt, um die digitalen Anforderungen zu erfüllen.
Bislang haben Unternehmen das Datenwachstum durch das Erhöhen von Speicherressourcen aufgefangen. Diese auf den ersten Blick logische Maßnahme erweist sich jedoch langfristig als sehr kostenintensiv. Übersteigen die Speicherkosten irgendwann den Mehrwert aus dem Datenschatz, muss das Big-Data-Prinzip betriebswirtschaftlich in Frage gestellt werden. Vom Potenzial großer Datenmengen zu profitieren, ist aber nicht nur im Dienstleistungssektor angesagt, sondern gerade auch im produzierenden Gewerbe. Ein Zurück zu weniger Daten ist ebenso wenig denkbar, da hochautomatisierte Prozesse nun einmal mit einem hohen Datenvolumen verbunden sind.
Also geht es darum, die bestehenden und täglich neu hinzukommenden Daten möglichst kostengünstig und sicher zu speichern. Selbst neue effiziente Speichertechnologien wie SSD sind aber nicht in der Lage, ungebremstes Wachstum langfristig zu vertretbaren Kosten zu bewältigen. Wird das Datenvolumen in die Cloud übertragen, spart dies zwar Investitionskosten für eigene Storage-Hardware im Rechenzentrum, doch das Problem des ständig zunehmenden Volumens ist nur verlagert.
Hinzu kommt die Herausforderung, Daten besser verwertbar zu machen, um davon tatsächlich auch prozessübergreifend profitieren zu können. Die schnelle Analysemöglichkeit wird immer wichtiger. Große Mengen sollen also möglichst kostensparend gespeichert werden und einzelne Daten aus dem großen Pool flexibel und kurzfristig verfügbar sein.
Die Entstehung redundanter Daten
Die nächste Frage ist, ob bei den vielen Prozessen während des Lebenszyklus auch redundante, also eigentlich überflüssige Daten entstehen, die das Speichervolumen unnötig noch weiter aufblähen. Tatsächlich wächst der Datenberg wesentlich durch beabsichtigtes oder unbeabsichtigtes Kopieren. Ein Großteil der Daten, die sich in Unternehmen im Umlauf befinden, sind nur Abbildungen bereits vorhandener Daten.
Eine gewachsene Struktur im Rechenzentrum bestehend aus vielen Tools und Produkten für einzelne Anforderungen wie Datensicherung, Replikation, Deduplizierung sowie viele physische Kopien für Test und Entwicklungsumgebungen.
© ActivioTrotz Deduplizierung in konventionellen Speicherarchitekturen entstehen immer wieder Kopien für verschiedene Anwendungsfälle, die dann eben auchgespeichert werden. Der Anteil der Duplikate am gesamten Bestand ist in vielen Unternehmen weitaus höher als vermutet. Das Marktforschungs- und Beratungsunternehmen IDC schätzt, dass 60 % des in Rechenzentren gespeicherten Bestands mehrfache Duplikate derselben Daten oder extrem veraltete Kopien sind, sprich de facto nicht benötigter Datenmüll. Die Mehrzahl der gespeicherten Daten sind überzählige Kopien von Produktionsdaten, die unterschiedliche Anwendungen generieren. Die oftmals ungebremste Vervielfältigung von Kopien ist demzufolge zu einem großen Teil mitverantwortlich für das vielerorts enorme Datenwachstum. Daher wäre es sinnvoller, die bisherige Datenverwaltung zu hinterfragen, bevor in Speicherressourcen – egal ob vor Ort oder in der Cloud – investiert wird.
Virtualisierung von Daten
Ein Ansatz, der noch nicht so weit verbreitet ist, sich in der Praxis aber bereits bewährt hat, ist das Copy-Data-Management. Das Konzept, das dahintersteckt, ist die Erstellung virtueller Kopien von Produktionsdaten. Dabei werden die Daten von ihrer zugrundeliegenden Infrastruktur entkoppelt, vergleichbar mit der Virtualisierung von Servern und Netzwerken, die bereits vor Jahren begann. Eine spezielle Datenmanagement-Plattform dient der Verwaltung der virtuellen Kopien. Bestandteil dieser Plattform sind bekannte Technologiewerkzeuge wie zum Beispiel Snapshots, Virtualisierung und Dedu-plizierung, die in einer einheitlichen Architektur zusammengefasst sind. Damit lassen sich unterschiedliche Anwendungsfälle (UseCases) vom klassischen Backup über Notfallbetrieb (Desaster Recovery) bis zu Test & Entwicklung von Anwendungsprogrammen abdecken. So können einzelne Datensilos abgeschafft werden.
Mit der Copy-Data-Virtualisierung vereinfacht sich die Architektur im Rechenzentrum, da viele Anwendungsfälle von der Datensicherung bis zur Bereitstellung von virtuellen Kopien für Test und Entwicklungssysteme mit einem Tool abgedeckt werden.
© ActivioMit der Verwaltung virtueller Kopien sind vormals redundante Daten auf eine einzige physische Kopie reduziert. Der hier zugrundeliegende Prozess läuft folgendermaßen ab: Anwendungs- und Produktionsdaten werden in ihrem nativen Format, anhand definierter SLAs auf Blockebene erfasst. Die physische – auch als ‚goldene‘ Kopie bezeichnete – Masterkopie wird erstellt und gesichert. Geänderte Blöcke werden daraufhin stets inkrementell gespeichert. Von dieser physischen Masterkopie lassen sich bei Bedarf unzählige virtuelle Abbildungen erstellen, die unmittelbar für alle Anwendungsfälle zur Verfügung stehen, sei es für Analyse, Entwicklung, Datensicherung oder Tests. Auf diese Weise wird weitaus weniger Platz auf vorhandenen Servern und Speicherressourcen beansprucht, da nur jeweils eine physische Kopie Speicherplatz beansprucht. Die virtuellen Datenkopien stehen sofort zur Verfügung – ohne Investition in teure Speicherinfrastruktur. Die virtuellen Kopien benötigen kaum Speicherplatz, da nur die neuen Datenblöcke zur goldenen Kopie hinzugefügt werden, während ein Verpointierungssystem mit den einmaligen vorhandenen Datenblöcken eine Vollkopie für den Bedarfsfall vortäuscht.
Unternehmen in der Fertigungsindus-trie, die mit großem Datenwachstum konfrontiert sind, können von virtualisierter Datenverwaltung maßgeblich profitieren. Dies macht das folgende Beispiel deutlich: Große Mengen an von Fertigungsanlagen erzeugten Sen-sordaten werden in das eigene Rechenzentrum oder eine Cloud gesendet und dort gesammelt. Datenexperten können mittels kundenspezifischer Software diese Daten analysieren. Ziel ist es, Muster zu finden, um intelligente Entscheidungen für die Optimierung von Fertigungsprozessen zu treffen. Dafür müssen gegebenenfalls viele Personen oder Teams die Daten von mehreren Maschinen gleichzeitig analysieren – und das sehr schnell. Da in diesem Fall zahlreiche Kopien bestimmter Daten erstellt werden müssen, kann die Virtualisierung hier ihre Vorzüge ausspielen. Durch die Bereitstellung virtueller Kopien ist ein weitaus schnellerer Datenzugriff möglich als über herkömmliche Storage-Umgebungen.
Wertvolle Erkenntnisse gewinnen
Mit den inkrementellen Teilen der Daten, die von den Maschinen kommen, wird der Datenbestand immer wieder aufgefrischt, so dass für die Recherche stets aktuelle Daten zur Verfügung stehen. Ein solches Anwendungsszenario ist heute bereits mit der Copy-Data-Virtualisierungstechnologie von Actifio in Kombination mit Oracle-Anwendungen und SQL-Datenbanken machbar. Bald soll es auch mit Datenbank-Architekturen wie NoSQL möglich sein.
Wenn es um Herausforderungen bei Storage und bei der Datenverwaltung für das Internet der Dinge und Indus-trie 4.0 geht, gibt es zweierlei Kostenfaktoren zu berücksichtigen: auf der einen Seite die offensichtlichen Kosten für Investitionen in Speicherressourcen und Systeme und auf der anderen Seite die indirekten Kosten, wenn es Unternehmen nicht gelingt, wichtige Erkenntnisse aus ihren Daten zu ziehen. Je mehr Daten, beispielsweise aus Sensoren von Maschinen, gesammelt und gespeichert werden, desto eher sind Analytiker in der Lage, daraus Erkenntnisse zu gewinnen. Sind allerdings die Kosten für die Speicherung und Verwaltung der IoT-Daten größer als der mögliche Nutzen, wird es problematisch. Damit die Gleichung aufgeht, sind moderne Ansätze wie virtualisiertes Copy-Data-Management erforderlich.
Indem Fertigungsunternehmen ihre Datenverwaltung konsolidieren und die Anzahl redundanter physischer Datenkopien reduzieren, können sie sich fit machen für das Industrie-4.0-Zeitalter. Und sie bewältigen damit nicht nur das Datenwachstum, sondern profitieren darüber hinaus auch von der effizienten Datenanalyse.
Autor: Gregor Hansbuer ist Sales Director für Actifio in der DACH-Region.












