文章

“端脑智能”中深度学习与知识图谱的“碰撞”

 端脑智能引擎

背景介绍

人工智能的时代,深度学习技术作为其核心驱动力,已经在图像处理、语音识别、和文字处理等任务上取得巨大的成功。然而深度学习自身的局限性,包括对大量标记数据的要求,预测结果的不可解释性以及难以结合人类意图和领域知识,使得人工智能领域的瓶颈日益凸显。因而建立知识图谱,融合知识图谱与深度学习,已然成为人工智能发展的重要思路之一。

德勤研发的“端脑智能”(Cerebrum)是以深度学习为核心引擎的企业人工智能应用平台。基于领先的深度学习技术和大量的样本数据,“端脑智能”能够成功地习得数据中的规律模式。然而,很多实际业务问题无法只依靠统计或规律的模式解决,还需要知识,特别是符号化的专家知识。因而,德勤“端脑智能”在最新的2.0版本中引入了知识图谱工程。

 

什么是知识图谱

知识图谱本质上是一种语义网络,表达了各类实体、概念及其之间的语义关系,是大数据和人工智能时代最为主要的知识表示方式。企业中的数据多为异源数据,如:结构化开放知识库、半结构化领域数据和非结构化网页文档,知识图谱可将这些数据中的内容整合为一个统一的知识网络。

相对于传统的知识表示形式,知识图谱可提供更多的隐含知识,如运用规则推理数据中存在的隐藏信息;通过连接预测发现实体间隐含关系;根据知识图谱上存在的社区获取知识间关联的路径;利用不一致检测技术发现数据中的噪声和缺陷。

 

端脑智能引入-知识图谱

知识图谱和深度学习是从两个方向实现智能化。例如,文档审阅系统,通过应用深度学习技术,对样本数据进行训练,生成风险识别模型;而知识图谱是把业务人员、内外部风险信息的知识罗列整理成一个图谱,再把问题转化成知识图谱上的一个推理。与深度学习相比,知识图谱的构建更为复杂。但是知识图谱对深度学习有很好的互补作用,很多深度学习解决不了的问题,知识图谱可以解决。深度学习解决端到端的问题,知识图谱则擅长知识类的问题。

图一:Cerebrum 2.0引入知识图谱工程

点击放大图片

为此,德勤“端脑智能”深度学习引擎引入知识图谱工程的建设,有效利用蕴含于知识图谱中的经验知识,在一定程度上摆脱深度学习模型对于大规模标记数据的依赖。另外,“端脑智能”将离散化知识图谱中的语义信息表达为连续化的向量,从而使得知识图谱的先验知识能够成为深度学习的输入,并利用知识作为优化目标的约束,指导深度学习模型的学习,以提升模型的性能。

 

端脑智能在合同管理中的应用

合同文本是企业商业关键信息的重要载体,信息化发展让越多越多的企业认识到合同管理是企业法律服务的重要部分。目前“端脑智能”已在合同管理中,采用深度学习与知识图谱相结合的技术。

场景一:通过行业语料的积累和处理,“端脑智能”为合同、协议等文本构建深度语言模型,并通过构造知识图谱,以业务专家的经验理解文本语义,大幅提高了合同关键信息提取和合同风险识别的准确率和效率。

图二:“端脑智能”在合同审阅中的优势

点击放大图片

场景二:针对合同自身及相对方,整合内外部风险信息,包括诉讼、经营异常、管理层变更、内部违规等信息,构建知识图谱,以可视化的方式展现各合同要素、合同相对方、内外风险的联系,包括:

外部风险感知:外部大数据引入与整合,提升企业对外部的风险的感知和掌控能力。

内部风险感知:内部合同风险(如履约问题),在集团范围内的实时感知与传递。

风险全局预警:通过图的关联识别能力,提供从特定企业/合同条款,到所有关联内容的预警能力。

图三:交易相对方风险预警示例

点击放大图片

知识图谱及深度学习相结合的应用不仅能帮助用户找到直接的风险点,更为企业合同管理方式带来颠覆式创新与价值。以知识图谱为代表的知识工程,和以深度学习为代表的机器学习,正逐渐脱离各自独立发展的轨道,走上协同并进的新道路,已经在社交、反欺诈、数据治理、推荐等领域上大展拳脚。“端脑智能”融合了知识图谱技术,将前沿算法与业务经验相结合,为企业打造更加专业的整体智慧解决方案。

此内容是否提供了您需要的资讯?