Data Catalog – kluczowy element świadomego zarządzania danymi

Artykuł

Data Catalog – kluczowy element świadomego zarządzania danymi

Cykl: Wyzwania Chief Data Officerów | Publikacja #3

Obecnie ilość danych jakimi dysponuje organizacja jest ogromna i stale rośnie. Stanowi to nie tylko szansę, ale również duże wyzwanie. Aby utrzymać konkurencyjność, redukować koszty oraz podnosić bezpieczeństwo, firmy muszą obsłużyć ich rosnącą liczbę i przyspieszać wymianę informacji. Dlatego tak ważne jest uporządkowanie posiadanych tysięcy lub milionów zbiorów danych.

Chief Data Oficer musi mieć na uwadze, że Data Catalog jest kluczowym elementem świadomego zarządzania danymi. Propagowanie w organizacji świadomości o jego istnieniu oraz opieka nad jego porządkiem nie tylko świadczy o dojrzałości organizacji, ale także pozwala z perspektywy czasu odpowiedzieć na pytanie jak efektywnie wykorzystywać dane, aby pomóc w realizacji celów strategicznych i operacyjnych. Chief Data Officer, który swoimi działaniami pomoże uzyskać firmie kontrolę nad posiadanymi danymi, a tym samym zagwarantuje jej sukces, naprawdę zasłuży na swoje miejsce w już mocno obsadzonych zarządach wielkich firm.

 

Jakie są typowe wyzwania, przed którymi staje Chief Data Officer oraz sposoby radzenia sobie z nimi za pomocą katalogu danych?

Jednak czym właściwie jest Data Catalog?

Katalog Danych to spisana w jednym miejscu logiczna struktura danych posiadanych w organizacji, wzbogaconych o profilowanie danych, metadane i metadane generowane przez użytkowników, które mogą obsługiwać i zarządzać pełnym przepływem danych od momentu ich odkrycia do dostarczenia i wykorzystania. Pokazuje on szczegółowo zasoby danych organizacji i ich lokalizację, pomagając użytkownikom oraz specjalistom w szybkim znajdowaniu danych najbardziej odpowiednich do dowolnego celu analitycznego lub biznesowego.

Jednym z kluczowych elementów katalogu danych są metadane. Są one kluczem do uzyskania dostępu do danych badawczych, bez nich właściwe zrozumienie i ponowne wykorzystanie posiadanych zasobów jest bardzo trudne, a wręcz może okazać się niemożliwe.
 

Czym są metadane?

Metadane dostarczają ustrukturyzowanych informacji umożliwiających uporządkowanie danych. Ułatwiają wykorzystanie i zarządzanie zasobem informacji poprzez ich opisywanie, tłumaczenie czy lokalizowanie. Często określa się je mianem „danych o danych’”. Istnieją trzy główne rodzaje metadanych:

  • Metadane opisowe - opisują zasoby w celu ich odnalezienia i identyfikacji.
  • Metadane strukturalne - opisują relacje i zależności pomiędzy poszczególnymi zbiorami oraz elementami tych zbiorów np. modele danych i dane referencyjne.
  • Metadane administracyjne - dostarczają informacji ułatwiających zarządzanie zasobami. Zawierają informacje takie jak sposób i datę jego utworzenia, typ pliku i informacje dotyczące dostępu.

 

Jakie praktyczne korzyści Chief Data Officer może uzyskać wdrażając Data Catalog w przedsiębiorstwie?

Niezależnie od tego, czy mówimy o jakości, zgodności, migracji do chmury i wiedzy o danych, czy też o uczeniu maszynowym i sztucznej inteligencji, inwestycja w wykaz danych to cenna inwestycja. Przyjrzyjmy się wachlarzowi korzyści jakich może nam dostarczyć wdrożenie Data Catalog’u:

Katalog danych w przedsiębiorstwie jest niezbędny, ale przy tak wielu produktach do wyboru, jak wybrać właściwe rozwiązanie?

Dla Chief Data Officer’a narzędzie klasy Data Catalog jest szczególnie istotne z perspektywy organizowania obszaru zarządzania definicjami i rozumienia kluczowych danych przetwarzanych w organizacji. Chief Data Officer jako główny interesariusz rozwiązania, ale też często sponsor narzędzia, powinien czuwać nad pracami mającymi na celu wybór i wdrożenie narzędzia. Rozważając dostępne na rynku oprogramowanie wie, że warto mu się przyjrzeć nie tylko pod kątem jego oceny przez ekspertów czy udziału w rynku, choć to również jest bardzo ważne, ale także pod kątem możliwości biznesowych, technicznych i dopasowania do strategii przedsiębiorstwa oraz kosztów.
 

Przyjrzyjmy się kilku rozwiązaniom dostępnym na rynku oraz wybranym kryteriom ich oceny.

Informatica Enterprise Data Catalog

Rozwiązanie Enterprise Data Catalog oferowane przez Informatica zyskało miano lidera według raportu IDC MarketScape: Worldwide Data Catalog Software 2022 Vendor Assessment1. Zwrócono w nim uwagę na niezaprzeczalny wiodący udział Informatica w całym rynku oprogramowania do integracji i zarządzania danymi. Warto zwrócić uwagę, że Informatica nazywana jest także od wielu lat liderem Gartner Magic Quadrant. Informatica wciąż rozwija swoje produkty, aby sprostać wymaganiom integracji danych i inteligentnych przypadków ich użycia w nowoczesnych środowiskach danych. Katalog danych Informatica jest częścią Intelligent Data Management Cloud, umożliwiając modernizację i rozwój strategii danych przedsiębiorstwa.2

Collibra Data Intelligence Cloud

Po dokładnej ocenie strategii i możliwości firmy Collibra, firma IDC umieściła ją w kategorii Liderzy w IDC MarketScape dla światowego oprogramowania do katalogowania danych3. Firma Collibra ma ugruntowaną pozycję na podium rynku oprogramowania, ze szczególnym uwzględnieniem dużych dostawców w ściśle regulowanych branżach. Oferuje wysokiej klasy rozwiązania do zarządzania danymi (tj. polityką, prywatnością, ryzykiem) oraz analizy danych. Chmura Collibra Data Intelligence Cloud jest pomocna zarówno dla biznesowych jak i technicznych pracowników organizacji, wspierając w dostarczaniu wiarygodnych danych do szerokiego zastosowania. Pomaga zarządzać i katalogować dane, śledzić ich pochodzenie, jakość oraz dbać o bezpieczeństwo danych z różnych źródeł.4

Precisely Data360

Portfolio oprogramowania Precisely zostało zbudowane poprzez przejęcia, łącząc wiele różnych technologii i zespołów pod jedną marką. Zostało umiejscowione w kategorii Liderzy w według raportu IDC MarketScape: Worldwide Data Catalog Software 2022 Vendor Assessment5. Firma istnieje na rynku od 1968 roku, początkowo słynęła z integracji dużych wolumenów danych na dużą skalę, jednak stale rozwija swoje portfolio, pomagając Klientom budować katalogi oraz dbać o integralność, dokładność i spójność danych. Dodatkowo Precisely oferuje unikalną funkcję ankiety do zbierania wiedzy o zasobach danych, modelach lub regułach, która pomaga zrozumieć w jaki sposób posiadane zasoby danych są wykorzystywane.6

Pomimo, że poddaliśmy ocenie zaledwie kilka produktów, już na tej podstawie można zauważyć, jak ogromy potencjał tkwi w dedykowanych Data Catalog’owi narzędziach. W zależności od specyfiki danej organizacji, jej obszarów zainteresowania i problemów z którymi się boryka, odpowiednio dobrane narzędzie do katalogowania danych może skutecznie wpierać świadome zarządzanie danymi. Równie ważne jest, aby zapewnić Chief Data Officer’owi niezbędne zasoby i wsparcie w organizacji, dzięki temu firma skutecznie zaadresuje potrzebę silnego przywództwa w zakresie strategii danych i zarządzania aktywami informacyjnymi oraz w pełni wykorzysta to, co może być jej najcenniejszym zasobem.
 

Autorka artykułu: Anna Mazur

 

1 IDC MarketScape: Worldwide Data Catalog Software 2022 Vendor Assessment | Informatica
2 https://www.informatica.com/
3 Collibra positioned as a Leader in the IDC Marketscape for Worldwide Data Catalog Software | Collibra
4 https://www.collibra.com/us/en
5 IDC MarketScape: Data Catalog Software 2022 Vendor Assessment - Precisely
6 https://www.precisely.com/

Jeśli zainteresował Cię ten artykuł, to zapraszamy do pobrania Raportu Chief Data Officer 2022

Raport: Chief Data Officer 2022

Kim jest CDO i jaka jest jego rola w organizacji?

Raport Chief Data Officer przedstawia wyniki badań dotyczące roli CDO w organizacji. W dzisiejszych czasach dane są fundamentalną częścią każdej organizacji, a Chief Data Officer’owie (CDO) odgrywają kluczową rolę w ich identyfikacji i odpowiednim wykorzystaniu przez firmy.

Pobierz raport
Czy ta strona była pomocna?