文章

智慧审计的七种武器之知识图谱  

智慧审计应用与创新(第七期)

在大数据和人工智能时代,数据是非常重要的资源。通过知识图谱,可以将企业海量且繁杂的数据内容整合为一个知识网络,从而突破关系型数据库的限制,更精准、迅速地攫取数据价值,提高内审的效率和精度,为企业打造更加高效、专业的风险管理方案。

1. 形态

随着大数据时代的到来,大数据分析技术受到了广泛关注,而将海量的数据转化为知识,是大数据分析的关键。知识图谱技术提供了一种从海量非结构化数据(如文本、图像)中抽取计算机能够理解的结构化数据的手段,对大数据时代的知识获取、知识共享、知识创新具有非常重要的应用价值。

知识图谱是语义网络的知识库,以语义网络为基础,结合自然语言处理、机器学习、数据挖掘、知识表示等技术,旨在描述客观世界的概念实体事件以及其之间的关系。通过知识图谱可以高效直观地刻画目标主体(如企业、事件等)之间地关联网络,从而全维度地对企业进行画像,立体复现主体的真实情况和错综复杂的关系。

2. 招式

相对于传统的知识表示形式,知识图谱可提供更多的隐含知识。利用知识图谱技术,可以将银行内部、外部海量且繁杂的数据内容整合为一个统一的知识网络,通过与银行业务经验相结合,实现知识图谱技术在银行内部审计中的具体应用。

 

  • 反欺诈
    除了通过信息造假等手段进行欺诈申请外,不少欺诈会涉及团伙作案并形成复杂的关联网络,这就给反欺诈审核带来了新的挑战。知识图谱包含丰富复杂的关系,这种直观的表示方法可以帮助我们更有效地分析复杂关系中潜在的风险。
  • 企业风险图谱
    由于企业业务间的交叉、创新,外部的风险对企业的影响越来越大。通过构建企业风险图谱可以描绘企业风险视图全貌,结合外部风险点,实现内外部风险数据的融合,从而高效地感知外部风险的传导、渗透对企业的影响。如果某公司风险发生变动,可以通过经营关系、担保关系、投资等关系进行传播,通过知识图谱可以轻松通过复杂网络挖掘进行判断。
  • 关联担保识别
    银行信贷审批对关联担保十分敏感。中小企业为了满足银行放贷要求、提高其信用等级,通过关联企业、产业链上下游客户、关系人等相互担保,形成担保链乃至关系更为复杂的“担保网”。担保链中的企业普遍存在超出自身实力对外融资和担保的现象,担保链整体净资产无法覆盖银行信贷风险,容易爆发风险连锁反应。基于知识图谱可以直观高效地识别出客户是否存在循环担保和多头抵押。
  • 资金监管
    传统的贷后资金管理往往流于形式,通过知识图谱可以掌握账户交易情况,通过账户及账户间交易和交易特征(交易时间、形式等)可以挖掘循环交易网络。

  • 失联客户管理
    现实中,借款人借后不还,进入“失联”状态的情况,即便试图联系借款人曾经提供过的其他联系人,仍无法联系到本人,使催收人员也无从下手。通过知识图谱复杂关联网络可以发现更多的关系,挖掘出更多潜在新联系人,大大提高催收成功率。

3. 实战

场景1:银行信贷反欺诈知识图谱

反欺诈是信贷领域非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化和非结构数据)整合在一起,构建反欺诈知识图谱,从而有效地识别出欺诈案件,是当前业内较为关注的应用趋势。

  • 数据收集:客户实体及担保等关联实体、地址、社会关系、受理分支行、受理行员等信息;
  • 建立模型:通过知识图谱建模、实体与关系的抽取与清洗,得到客户关联关系图谱;
  • 模型应用:当新客户在银行进行申请和办理业务时,该客户作为新增实体会与现存图谱产生一定的关联;
  • 发现异常:挖掘与客观现实相冲突的实体间的关系,识别为异常情况;
  • 人工排查:人工分析异常情况,确定欺诈行为;
  • 认定欺诈:固化此种欺诈模式,利用图搜索算法定时批量和监听式发掘欺诈嫌疑人或团伙,预防该欺诈再次发生。

通过引入外部数据源,构建知识图谱,查找同一实体与多个实体通过同一种关系相连的情况,可以检测信息是否存在冲突,排查欺诈嫌疑。

场景2:企业风险知识图谱

通过引入外部风险数据,构建企业风险画像,结合内部风险数据,实现内外部风险数据的融合,从而高效地感知外部风险对企业的传导,更有效地预警潜在风险,提高内审效率。

  • 外部数据采集
    政府机构数据源:公安局、人力资源与社会保障局、法院、检察院
    非政府机构数据源:主流新闻媒体、社交网络平台
  • 风险信息分类:通过自然语言处理、机器学习等技术,细化企业负面信息类别。以负面新闻为例:

  • 建立模型:通过知识图谱建模、实体与关系的抽取与清洗,构建企业风险画像;

  • 风险传导感知:如果某公司风险发生变动,可以通过知识图谱识别风险传导链路,及时预测此风险事件牵扯到的相关主体,从而触发风险预警,实现动态监控。

截图来自于neo4j图数据库

4. 奥义

在传统的银行业风险管理流程中,多通过对目标主体的特征进行严格审核,例如:负债、资产状况、现金流水等方面,但是这些都无法判断主体间的关联风险。知识图谱带来的天然关联检索的特点,将内审人员从审计数据量庞大且类别纷繁复杂的困境中解放出来,将隐含的关系网络梳理清楚,有效地提升了内审工作的效率,扩大了业务覆盖范围,发现了更多潜在的风险与问题,从数据中挖掘出更大的价值。

此内容是否提供了您需要的资讯?