Article

Data Lakes: Migration zur Cloudera Data Platform (CDP)

Deloitte Whitepaper „The Data Lake Journey“

Data Lakes sind heute eine Kernkomponente der IT-Infrastruktur in vielen Unternehmen. Sie speichern Petabytes von kritischen Geschäftsdaten und ermöglichen Analysen von großen Datenmengen. Häufig basieren die Data Lakes auf Cloudera (CDH) oder Hortonworks (HDP) Technologie. Angesichts des bevorstehenden Endes von deren Produktlebenszyklen stellt Deloitte im Whitepaper die besten Methoden vor, um die vorhanden Data Lakes möglichst ohne geschäftskritische Ausfallzeiten auf die neue Cloudera Data Platform (CDP) zu migrieren.

Moderne analysegesteuerte Anwendungsfälle erfordern Flexibilität, Agilität und Elastizität. Doch klassische Data Lakes, die üblicherweise auf Hadoop-Technologie basieren und in den Rechenzentren von Unternehmen eingesetzt werden, können diese Anforderungen nicht länger in vollem Umfang erfüllen - daher ist der Einsatz neuer Lösungen erforderlich. 

Im Whitepaper „The Data Lake Journey“ untersuchen wir die verschiedenen Optionen zur Weiterentwicklung bestehender Cloudera- und Hortonworks-Plattformen mit den Möglichkeiten der Cloudera Data Platform (CDP). Mit der Veröffentlichung von CDP hat Cloudera die Einstellung der alten Cloudera- (CDH) und Hortonworks- (HDP) Plattformen angekündigt (CDH 5.x und HDP 2.x - Ende 2020, CDH 6.x und HDP 3.x - Q1 2022). Im Whitepaper werden drei Szenarien vorgestellt, die Kunden beim erfolgreichen Übergang zur Cloudera Data Platform helfen: 

Migration zur CDP Public Cloud

Wenn die rechtlichen und technischen Anforderungen an eine verfügbare öffentliche Cloud-Umgebung im Unternehmen erfüllt sind, ist die CDP Public Cloud die präferierte Option. Daten werden in Objektspeichern von Cloud-Anbietern gespeichert; Data-Science-Umgebungen und Analyse-Komponenten (wie Apache Spark) können flexibel über Container-Technologie skaliert werden. Cloudera SDX etabliert einen gemeinsamen Security Layer über mehrere Cloud-Umgebungen hinweg. 

Upgrade auf CDP Data Center 

Wenn Unternehmen nicht in der Lage sind, eine Cloud-Umgebung zu nutzen und ihre bestehende On-Premises-Infrastruktur wiederverwenden möchten, ist ein Upgrade auf CDP Data Center mit der Software Cloudera Runtime der bevorzugte Migrationspfad. Cloudera Runtime kombiniert Open Source Projekte aus beiden Plattformen (CDH und HDP), ersetzt und entfernt aber auch einzelne Projekte. Um die Ausfallzeiten geschäftskritischer Anwendungen vor der Migration zu minimieren, ist eine detaillierte Analyse der derzeit verwendeten Plattform-Tools erforderlich. 

Migration zu CDP Data Center 

Eine Migration zu einer komplett neuen On-Premises-Infrastruktur wird durch drei Gründe gerechtfertigt: Die Infrastruktur ist veraltet, es wird ein Appliance-Produkt verwendet oder eine minimale Auswirkung auf bestehende Big Data & AI-Anwendungen ist erforderlich. Eine Migration zu CDP Data Center ermöglicht es Unternehmen, ihren Data Lake um einen Objektspeicher zu erweitern, eine Trennung von Daten und Berechnung durchzuführen sowie containerbasierte Berechnungsumgebungen zu verwenden.

Date Lake Migration mit Deloitte

Deloitte empfiehlt, eine inkrementelle Migrationsstrategie für Anwendungsfälle zu verfolgen - beginnend mit einer detaillierten Analyse und Priorisierung der Anwendungsfälle. Die Analyse identifiziert Anwendungen, die veraltete oder eingestellte Open-Source-Projekte verwenden. Deloitte bietet standardisierte Migrationspfade für diese Anwendungen an und unterstützt Kunden bei der Vorbereitung der Migration. Der detaillierte Migrationspfad zu CDP ist abhängig von der Infrastruktur, den organisatorischen Voraussetzungen sowie der Zukunftsvision des jeweiligen Unternehmens. Deloitte unterstützt Kunden bei der Entwicklung einer maßgeschneiderten Vision und Roadmap für ihre zukünftigen Big Data & AI-Anwendungen und optimiert so die Datenarchitektur während der Migration.

März 2021 
Deloitte wurde mit dem 2021 EMEA Partner of the Year Award von Cloudera ausgezeichnet.

Weiterführende Informationen

Marc Beierschoder (Partner, Deloitte Deutschland) und Martin Mannion (Director, Deloitte Irland) im gemeinsamen Cloudera-Interview:

Building an effective data approach in a hybrid cloud world

Building an effective data approach in a hybrid cloud world – part 2

Deloitte wurde mit dem 2021 EMEA Partner of the Year Award von Cloudera ausgezeichnet.

Fanden Sie diese Information hilfreich?