文章

【德勤数据治理2.0】

第十期:金融数据模型对数据资产管理的作用

前言

随着大数据时代的来临,对数据的重视提到了前所未有的高度,数据已经成为企业组织可以充分挖掘的资产财富。金融行业作为信息化程度最高的行业之一,信息系统产生的数据已经成为行业最核心的资产之一。但由于金融机构的数据流转复杂,在缺乏清晰的数据架构、数据流图以及数据与业务之间的关系的同时,也普遍存在数据模型混乱,数据整体质量不高,开发团队迫于现实压力更加关注功能需求的实现,忽略非功能需求的管理,导致数据模型质量不高,存在先污染后治理的现象。在《【德勤数据治理2.0系列】第九期:迈向高可信数据资产 构建企业数据资产运营体系》中,我们已经详细介绍了数据资产运营体系。本文将详细介绍在金融数据资产诞生之初的数据模型设计阶段,如何更好管理数据资产,提升数据资产质量,高效释放数据资产价值。

 

金融数据模型的定义与构成

企业级数据模型是描述在业务开展中所需要的数据及数据的分类组织方式,是企业范围内对业务数据资产的统一认识和共享语言。德勤企业级金融数据模型由概念模型金融词汇表组成。其中,概念模型是数据特征的抽象,是业务流程、业务知识到数据概念的转化,实现业务架构向数据架构的完整映射,统一技术和业务对金融机构范围内业务概念的认知。基于丰富的金融行业经验,德勤构建了八大主题领域、近六百个业务对象以及一万余项对象描述的数据模型资产,以此表达实际金融业务中的具体关系,分别由业务对象、对象描述以及对象之间的关系构成:

  • 业务对象的定义,通过抽象金融机构内各类业务本质得到的,可用于表示一个或多个机构内的事物,并可以逐级向下细分为多个子业务对象。例如:银行产品是一个抽象的业务对象,可细分为资产类、负债类和中间业务类。其中,资产类产品又可细分为贷款类产品、投资类产品等。
  • 对象描述的定义,用于表达金融机构业务经营活动中关注的基础信息项,通过业务对象或关系相关联来表达业务对象。例如:产品的名称、代码、描述以及业务适用条件信息等。
  • 对象关系的定义,定义业务对象间的关系,表达业务对象与其他业务对象的联系,例如:关系名称、关系说明、关系对应的主从业务对象、关系关联业务对象等。

图1:企业级概念模型

金融词汇表指企业范围内表达与经营、管理活动相关的业务数据概念的用词集合,包括规范的用词表达及其相关业务解释。金融词汇表是概念模型在具体应用场景中的具象描述,是概念模型的实例化延展。概念模型业务对象的名称及业务含义可以进一步具象,其技术规范应遵循并兼容概念模型的定义。

图2:概念模型与金融词汇表的关系

 

如何构建企业级金融数据模型

德勤通过多年积累的丰富的金融行业项目经验,归纳总结出通过自上而下的业务流程梳理自下而上的系统表单梳理相结合的方式,构建企业级金融数据模型。以银行贷款业务为例,如下:

自上而下的贷款业务流程梳理
  • 基于贷款业务流程,确定业务主题分类。
  • 按照业务主题分类,分析贷款业务流程、报表表单,识别贷款相关业务对象以及各业务对象间的关系,补充贷款业务对象的描述,完成企业级概念数据模型和逻辑数据模型的构建。
  • 贷款业务领域专家基于积累的实践经验及项目收获,在建模方法的指导下,提炼和概括企业业务本质。
自下而上的贷款系统数据字典梳理
  • 梳理贷款业务系统数据字典,理解数据库表和字段的业务含义。
  • 对数据库表进行提炼整合,归纳总结出业务对象、对象间的关系,补充业务对象的描述。
  • 基于贷款业务流程对业务对象和属性进行分类,完成业务主题、概念模型和逻辑模型的构建。
     

图3:自上而下 & 自下而上构建数据模型

自上而下的业务流程梳理,从业务应用的视角出发,理解数据和构建数据模型,使数据建模人员、数据模型管理人员、数据资产开发人员更容易、更快捷理解业务,使数据模型更具有稳定性、可适应性。数据模型的可扩展性,是一个长期验证和优化的过程,需要在实际业务处理过程中不断反复迭代,不断优化。

自下而上的系统数据字典梳理,从物理数据模型的技术视角出发,提炼、抽象、整合而成数据模型,使数据模型更具有可实施性、可落地性。同时,在梳理数据字典过程中,根据业务习惯提炼业务词汇补充到金融词汇表,进而完善企业级数据模型。
 

如何通过金融数据模型管理数据资产

企业级金融数据模型主要回答金融机构“有哪些数据”、“数据是什么”的问题,例如:金融机构范围内共同认知和使用的业务对象有哪些?金融业务对象是如何进行描述的?业务对象之间是什么关系?如果要回答“数据在哪里”,就需要梳理并形成企业级数据分布图(也叫“数据地图”,Data Map),建立企业级金融数据模型的数据项与金融机构内系统数据库、表、字段之间的关系。

图4:企业级数据分布的作用

以企业级金融数据模型为基础,借助系统数据库、表、字段,对存量数据资产集中式盘点,对增量数据资产自动化注册,做好数据资产识别和数据资产目录挂接,最终形成覆盖全金融机构数据资产的全景分布图。以概念模型“参与人”主题为例,“公司客户”是其中一个业务对象,“企业经济性质”作为其中一个数据项描述“公司客户”。参考德勤的金融词汇表,“企业经济性质”根据业务习惯可具象为“企业经济类型”、“企业类型名称”、“经济类型信息”、“经济性质代码”等多个业务词汇,在ECIF系统、核心业务系统、数据仓库等关键系统识别到相关表与字段。这些表、字段挂接在“企业经济性质”数据项下,即可形成由抽象企业级数据模型到具体系统数据库、表、字段的全链路的数据分布图。

图5:企业级概念模型与企业级数据分布的关系

企业级金融数据模型和企业级数据分布图,从底层支撑数据资产运营管理。其中:

  • 概念模型:为数据资产提供标准的数据分类和定义,解决数据资产定义缺失、数据资产业务关系缺失等问题,例如:数据资产业务属性的“资产项名称”、“业务流程”、“业务定义”等,使数据资产使用人员,尤其是对业务不熟悉的技术人员,清晰掌握数据资产的定义。
  • 金融词汇表:为数据资产的标准规范提供良好的载体,解决数据资产定义不严谨、数据资产没有遵循标准和规范设计等问题,例如:数据资产技术属性的“资产项类型”、“资产项长度”、“资产项精度”、“资产项值域”,以及管理属性的“资产权属部门”、“资产安全等级”、“对应信息标准”等,使数据资产使用人员清晰了解数据资产的开发标准和要求。
  • 数据分布图:为数据资产的质量监控、价值评估提供治理依据,例如:数据资产质量健康指数分布、数据资产价值密度的分布、数据资产使用热度的分布等,使数据资产使用人员,尤其是中高层管理人员对数据资产的治理情况、使用情况、价值情况一目了然。
     

大型金融机构业务品种齐全,信息系统数量多,在过去多年的系统建设过程中,普遍存在缺少企业级数据规范,对各系统数据难以集中整合、难以互通共享、数据资产不能充分利用等问题。要解决这些问题,可以通过构建企业级金融数据模型和数据分布图,从最底层开始对数据资产从业务层面、技术层面进行全面的定义,实现:

  • 统一金融机构数据语言。金融词汇表从业务层面对全行数据统一定义,成为业务与技术沟通的桥梁,规范金融机构的数据需求、共享和管理。
  • 指导系统建设及落地。金融机构信息系统建设需要以企业级数据模型作为规范,使用企业级数据模型指导系统应用级数据模型的设计,提高系统开发质量。
  • 促进数据资产价值释放。通过建立面向多维视角的数据资产目录,降低业务用户数据应用的门槛,推动金融数据民主化建设。
     

 

结语

金融机构在大规模的开展数据应用,驱动数字化转型的过程中,需要构建全面、统一、规范的企业级金融数据模型,统一机构范围内的数据语言,指导信息系统的建设和落地,推动数据资产稳定、持续地运营管理,充分释放数据资产价值,从而提升金融业务智能化水平,实现机构可持续发展。

文章作者:德勤管理咨询中国分析与认知服务领导合伙人尤忠彬、德勤管理咨询中国合伙人王朝辉、德勤管理咨询中国经理陈禹海、德勤中国风险咨询副总监何向飞。

如果您对数据治理2.0系列文章有任何问题或意见,敬请联系:

德勤中国          

北京
电话:+86 10 8520 7788

上海
电话:+86 21 6141 8888

重庆
电话:+86 23 8823 1888

香港
电话:+852 2852 1200

德勤管理咨询邮箱:cndcmarketing@deloitte.com.cn
德勤风险咨询邮箱:RAMN@deloitte.com.cn

 

 

 

《德勤数据治理2.0》

系列文章 

Insert Custom CSS fragment. Do not delete! This box/component contains code needed on this page. This message will not be visible when page is activated.

此内容是否提供了您需要的资讯?