議題觀點
數據浪潮來襲,企業如何穩健打底,數據平台建置與數據治理實務分享
勤業眾信管理顧問服務 / 黃志豪執行副總經理、林宛芳協理
數位轉型與數據浪潮下,企業期盼收納與掌握龐大的數據資產,從中發掘數據意涵與分析價值,而企業各式各樣的數據常分散於不同資訊環境或單位,形成數據孤島(Data Silos),因此企業面臨的首要議題便是如何建立一個整合性的企業數據平台(Enterprise Data Platform)。隨之而來龐大的數據量如何持續確保數據品質與可靠性,促使企業正視數據治理(Data Governance)能力提升的刻不容緩。平台的長期穩健發展,企業又該從哪些面向省視自身數位韌性(Resilience)的能力。企業在實務執行數據平台建置與數據治理上卻遭遇到幾個難題,導致遲遲難以開始動手。
數據驅動vs 應用驅動
應該打造數據驅動(Data Driven)或應用驅動(Application Driven)的數據平台呢? 大數據時代引領之下,企業期待打造一個數據驅動決策的數據探索環境,然而若毫無分析命題與目的,可能造成企業不知從哪裡開始收納數據,或無目的性的廣納數據造成數據平台建置時程太長且成本過高,最終無法產生實務效益的下場。數據驅動與應用驅動兩種模式並不衝突,在數據驅動的願景下,同步打造符合商業應用場景的數據環境,提升數據的實務價值進而逐步擴增數據量,因此,探索數據應用場景,成為企業對焦數據平台彰顯價值效益的起始點。
打造企業專屬的數據目錄與數據資產架構,讓企業有一致的數據溝通語言基礎
企業數據眾多卻因數據坐落於不同業務、單位、系統等,造成數據視圖零散片段,企業成員間缺乏一致的數據溝通語言,導致數據交換溝通成本高或誤用數據,因此企業首要必須對龐大的數據進行系統化的歸納整理,建設專屬數據目錄架構。
數據資產盤點與建構數據目錄,主要有兩種模式。自下而上歸納模式,從資訊系統的視角出發,梳理資訊系統的功能物件與資料表結構內容,再與業務型態對應,建立數據目錄架構;自上而下演繹模式,從企業價值與業務流程的視角出發,以時間軸探索核心數據的生成與變化,搭配實務營運分析報表掌握數據曝光度與主要使用對象,形成其數據主題域、數據架構、數據資產目錄。勤業眾信引導企業全面探索數據主題,建構企業專屬的數據資產目錄,使企業數據資產清晰透明化與結構化,提供企業一個完善的數據溝通與分享基礎。
勤業眾信的數據平台發展方法,兼顧數據發展與價值體現,並融合數據治理制度化
依據數據目錄框架將數據資產匯流至數據平台,傳統數據平台建置採用一步到位模式,然而這一步卻動輒需要兩年的時間成本,在現今瞬息萬變的商業環境下,數據應用場景與資訊環境都轉變很快,此種建置模式容易因需求改變造成數據價值持續下降的風險。因此,勤業眾信提出一個融合式的企業數據平台發展路徑方法,兼顧數據長期發展與短期體現數據價值,同時落實數據治理制度化,以確保數據長期使用效益。
下圖為企業數據平台發展路徑概念,首先於Foundation階段,全面性探索企業的數據關注焦點與梳理核心數據資產項目,以此為依據進行數據溯源,掌握重點數據環境與數據流,提供企業
Step 1 : Foundation,打造數據平台基礎架構與MVPs數據發展與治理藍圖
Foundation的關鍵任務為協助企業梳理數據的商業應用場景、探索核心數據資產、掌握數據來源資訊環境,找出數據發展與數據治理的能量缺口與關鍵優化點,進而規劃符合該企業的數據發展與數據治理中長期優化藍圖,協助企業依照藍圖建議逐步優化數據能量。
1. 數據發展與治理藍圖
勤業眾信協助企業規劃中長期的數據發展與治理藍圖,以MVP (Minimum Viable Product, 最簡可行產品) 為基礎進行數據整合與應用,每個MVP建置時程約三個月,所收納的數據必須能夠符合其應用場景需求以展現數據價值。顧問基於對企業的通盤理解與掌握,考量數據需求強度、數據關聯與相互影響性、資訊系統關聯性、併行發展可行性、建置時程、投入資源等影響因子,切割多個MVPs,每個MVP規範最佳範圍與建置順序,依照MVPs藍圖持續豐富化數據平台。而每個MVP進行時,同步進行該MVP範疇的數據治理制度化,例如數據商業定義、資料字典、權責單位等,確保該MVP上線時,其數據資產已具備被使用與共享的價值。
2. 企業數據平台高階架構規劃
MVP啟動的前置作業,企業須完成數據平台的軟硬體環境建置,包括資料庫、ETL工具、排程工具、報表工具等,勤業眾信協助企業規劃數據平台的系統架構、資料庫架構、數據流架構,高階架構圖如以下示意圖。
Step 2 : MVP1,顧問建置前導範例,兼顧數據平台建置規範化與數據治理制度化
數據建置與數據治理兩者環環相扣,實務執行時會建立數據資產目錄,並將商業主題與數據主題串連,掌握企業整體數據資產,清楚的商業定義與技術定義亦提升數據透明度讓使用者可以快速找到所需的數據。
MVP1包括以下關鍵任務:
- 數據建置:商業應用場景、數據盤點、數據整合與清理、數據模型建立、數據分析。
- 數據治理:治理組織、數據目錄、商業定義、技術定義、資料品質規則、權責單位、數據管理流程。
MVP1最終成果將協助企業達成以下核心目的:
- 數據建置並且體現數據價值,每個MVP先定義明確的關鍵優化點,確保MVP過程持續聚焦,上線時方可展現其數據價值與優化效益。
- 建立MVP前導範例,完成上述關鍵任務並且建立數據建置與數據治理的標準規範與流程指引,做為MVP future的實作參考依據與傳承。
- 預先培養企業數據發展基本功, MVP1由勤業眾信主導設計與建置,企業的主數據窗口一同參與執行過程,確保企業對於MVP執行流程與實作方法的理解與掌握。
Step 3 : MVP 2 & MVP Future,企業自主擴展數據能量,顧問退居諮詢
依照數據發展藍圖持續進行後續MVP實作,而MVP 2的進行模式改由企業主導,自主建置數據與同步落實數據治理,而顧問則退居諮詢角色。此階段的核心目的,係培養企業具備維運數據平台與數據治理的自主實作能力,確保可繼續完成數據發展藍圖的MVP future。而數據藍圖的落實過程,可依照企業的需求強度、人力資源配置、數據建置能力再行調整,甚或熟練後規劃同步進行多組MVPs加快數據藍圖進程。
企業通常收納數據
數據能量的穩健性,企業必須具備數位韌性
2022年7月日本爆發史上最大規模的電信通訊中斷事件所帶來的數位災害,促使政府積極推動企業應具備數位韌性策略,因此企業打造豐沛數據平台的同時,也必須思考加強數位韌性的對策,包括提升數據安全、數據備份、數據服務中斷的預防、減災、應變及數據復原等的規劃與落實,強化企業數據韌性體質。
總結
數據浪潮促使企業正視數據孤島(Data Silos)處境,企業已積極投入建置整合性企業數據平台(Enterprise Data Platform),數據驅動(Data Driven)與應用驅動(Application Driven)的建置模式,企業都必須考量商業應用場景與時效性,才得以體現數據的實務價值。而數據平台能否長期穩健發展的核心關鍵,在於企業是否具備數據治理(Data Governance)的能力,提升數據資產透明度與高質量,強化使用者對數據的信任度與黏著度。而企業對數位依賴的同時也更可能落入數位災害,因此企業更必須具有數位韌性(Resilience)的體質與對策,打造一個安全可靠的數位環境與數據平台。