Řešení

Důvěryhodnost dat díky přístupu Data Lineage

Možná jste to také slyšeli – data jsou ropou současnosti. Pokud vám ale data mají pomoci vést byznys nebo činit na jejich základě rozhodnutí, musíte zvážit kvalitu jejich řízení. Navíc je třeba znát celý proces od zdrojů dat až po jejich využití. Pomocí přístupu Data Lineage můžete objevit veškeré podrobnosti o původu dat, jejich vzniku a způsobu, jakým prochází vaší společností.

Sledujte svá data – od jejich vzniku do okamžiku jejich využití!

Proces Data Lineage lze definovat jako mapování datových cest. Během celého procesu nastává několik fází, které je nutné zprocesovat, aby bylo možné datový tok skrze firemní systémy správně pochopit.

Můžeme stanovit 4 fáze procesu Data Lineage:

  • Klíčové datové prvky – určení hlavních firemních uživatelů a organizace v průběhu několika workshopů za účelem zmapování bodů zásadních pro provoz firmy.
  • Zmapování datového toku – na základě vstupů z workshopů se zmapuje aktuální stav datového toku – každý z toků musí být popsán od momentu vzniku až po okamžik využití.
  • Konsolidace datových informací – po počátečním zmapování každého z datových toků se doplní všechny podrobnosti o datových zdrojích, jejich formě, datových spojích a dalších prvcích. 
  • Master mapa Data Lineage – pro vytvoření celkového obrazu jednotlivých map datových toků se určí jedna hlavní mapa s odkazy na podrobné náhledy.
image

Proč je proces Data Lineage důležitý?

  • Důvěryhodnost dat – abyste se stali datově řízenou organizací, musíte zajistit kvalitní data pro všechna oddělení společnosti, protože tato oddělení budou na datech závislá – budou potřebovat přesná data, aby mohla činit správná byznys rozhodnutí.
  • Měnící se požadavky na data – big data a jejich konsolidace může představovat velký problém, protože existuje několik zdrojových systémů současně či se plánuje zavedení dalších systémů, nebo se jednoduše zvyšují nároky na data a jejich využívání.
  • Řízení a správa dat – celkový proces Data Lineage poskytuje dobrý základ pro dodržování nařízení a řízení rizik (compliance).  Disciplíny v oblasti řízení dat rovněž zajišťují správný popis dat a řádný Master Data Management (MDM), aby vaši zaměstnanci díky přehledné dokumentaci data bez problémů našli a správně interpretovali všechny jejich atributy a metriky.
  • Mapa datových toků – zavedením tohoto procesu získáte přehled o všech datových zdrojích  a další sledování toků dat lze automatizovat pomocí nástroje Data Lineage.

Proces Data Lineage vám může data i datové toky objasnit. Pokud se nad svými daty zamyslíte a dojdete k závěru, že vám nepřináší požadované výsledky, pak je třeba váš přístup změnit, abyste mohli rozhodnutí na základě dat činit bez manuálních vstupů a úprav.

Možné případy/oblasti využití:

  • Self-service správa dat (Data Management) – umožní vašim zaměstnancům snadno opakovaně používat a transformovat firemní data. Bez správného sledování datových toků mohou ve výsledných reportech nastat duplicity či jiné nejasnosti, přičemž nalezení příčiny může být obtížné.
  • Migrace do cloudu – během této migrace se cloudové inženýrství snaží rozdělit systém do menších bloků objektů. Avšak v důsledku fragmentace velkého celku spolu nemusí jednotlivé bloky spolupracovat. Správná evidence nebo mapování dat je tak nutným krokem před každou migrací – před zahájením jakýchkoli změn musíte znát každý kousek vašich dat.
  • Velké banky, pojišťovny a další finanční instituce – tyto společnosti jsou pod přísným regulačním dohledem, a proto musí Data Lineage nebo původ dat nutně prokazovat.
  • Zdravotnictví – toto je další příklad přísně regulovaného subjektu – díky evidenci dat víte, odkud data pochází, kdo si je prohlížel, zda byla kopírována, získána apod. O jakékoli osobě můžete kdykoliv získat všechny informace.
  • A mnoho dalších…

Kontaktujte nás

Dominika Havelková

Dominika Havelková

Senior konzultant

Dominika je senior konzultantkou v týmu AI & Data, který je součástí společnosti Deloitte Česká republika. Zaměřuje se především na reporting a vizualizace prostřednictvím nástroje Microsoft Power BI.... více