文章

智慧审计的七种武器之文字识别(OCR)

智慧审计应用与创新(第四期)

智慧审计的七种武器已经揭晓了三个,这些武器在银行内部审计江湖中各显神通,为智慧审计打下了技术基础,为内部审计人员提供了披荆斩棘的工具。今天,我们将揭晓一种新武器——文字识别(OCR)技术,让我们一起来看它将如何发挥功力吧。

1. 形态

文字识别(Optical Character Recognition, OCR),是扫描图像文件后,图像经过预处理、图像切分、特征提取、匹配及模型训练等步骤将图片中的文字转化为可编辑文本的图像信息处理工具。文字识别是计算机视觉研究领域的分支之一,是模式识别和人工智能领域的一种应用。在商业化的运用中,文字识别是实现文字高速录入的一项关键技术,在金融票据识别、身份信息识别、合同信息提取等场景都有比较成熟的应用。

2. 招式

近年来,许多银行在数字化转型战略的驱动下不断强化新技术的引入和应用,文字识别技术作为一项采集图片信息的工具已经在很多实践案例中得到了运用:用户在手机银行上传身份证照片即可一键提取和录入身份证、有效期等信息;柜面人员扫描客户的银行存单即可采集存单流水号、客户号、金额等信息;业务办理人员扫描客户手工填写的表单即可采集勾选的性别、学历等信息等等。可以看到,文字识别技术在银行运营领域已经积累了十分成熟的应用场景,它也成为了银行提升用户体验、缩短办理时间、加强运营效率的“新武器”。

在内部审计领域,文字识别作为一个将图片信息文本化、可审计化的重要工具,能够为基于大数据的智慧审计提供更丰富的数据来源。此外,这种系统化的高效信息采集手段也可以帮助内部审计人员节省大量机械性操作所耗费的时间和精力。内部审计工作得以突破以往受制于手工录入信息而无法审核全量样本的限制,有助于降低抽样带来的系统性风险。随着内部审计人员不断创新,挖掘文字识别技术在内部审计工作的应用场景,这项技术将释放更大的潜能。

3. 实战

在对公客户信贷舞弊风险的年度内部审计中,内部审计部的老王负责审核对公客户贷款投向的合理性。在往年,老王会从行内信贷系统中随机抽取100个有贷款的对公客户信息,通过比对贷款投向信息与企业营业执照的经营范围是否匹配来识别舞弊信号。这意味着他每年要手工录入并核对100个企业营业执照上的统一社会信用代码、企业名称、经营范围信息,然后才能开始后续的内部审计工作。相对于枯燥的数据录入工作,老王更想将精力集中在舞弊风险审计规则的挖掘和设计上来提升内部审计工作的效率和价值。此外,老王认为100份样本并不能完整反映贷款投向的合理性,抽样十分容易遗漏高风险样本,是不是能通过某种方法来审计全量样本呢?

近日,首席审计官引入了文字识别技术,这使得老王能够从令他焦头烂额的手工录入工作中解脱出来。在应用这一技术后,老王只需要获取全量的企业营业执照照片,并输文字识别工具,就可以得到可编辑的文字信息。为了整理这些文字版营业执照,老王设计了一份数据汇总表单模板,规定了他所需要的信息,即统一社会信用代码、企业名称和经营范围。接着,老王通过自动化工具来汇总全量的营业执照信息。基于这份表单,老王就可以执行后续的审计程序,将节省下来的时间专注于发现其他舞弊信号,提升内部审计质量。

在某银行的概念验证 (Proof of Concept)案例中,人工录入一份营业执照的信息平均要花费5分钟的时间,有了文字识别技术和其他自动化工具的帮助,这项工作只要1分钟就可以完成,处理效率提升了约80%。有了文字识别技术的帮助,老王今年的内部审计工作效率将有很大提升。此外,信息处理效率和自动化水平的提升使得内部审计的全量样本成为可能,这大大降低了抽样审计带来的重要信息遗漏风险。

4. 奥义

内部审计部通过引入文字识别技术,可以将物理世界的图片信息转变为数据世界的可审计数据,大大释放了人工,使得全样本内部审计成为可能。

同时,文字识别技术为智慧审计打下了非结构化数据采集的基础,是助推智慧审计体系其他工具(如RPA、NLP等)发挥功效的有力支撑。

结语

随着大数据时代的到来和移动互联网技术的铺开,审计数据的载体变得越来越多样化,图片、照片、影像等资料承载着丰富的数据信息,为了解读藏在这些信息背后的复杂关系和潜在风险,内部审计部需要与时俱进,引入智慧审计工具来将这些非结构化数据解析为可审计的数字或文本信息,从而进一步揭示内部审计对象之间越来越复杂的关系。文本识别技术作为智慧审计重要的数据来源,是不可或缺的一种武器。智慧审计工具是降低人工成本、提升内部审计效率、促进内部审计创新的好帮手,内部审计部要灵活运用这些武器,逐步推进银行内审的智能化水平,凸显内部审计价值。

此内容是否提供了您需要的资讯?