文章

智慧审计的七种武器之自动语音识别 (ASR)

智慧审计应用与创新(第三期)

传统内审项目中涉及众多资料,包括外部法律法规、人行和银监会发文、公司内部制度、业务文档等文本资料以及业务交易等结构化数据,另外,还包括电话客服、客户投诉等语音数据,但这类语音数据由于难以分析往往被排除在内审范围外。而利用自动语音识别(ASR)技术,目前已经可以实现将语音数据转化为文本数据,再通过文本分析技术即可以实现对语音数据大规模的覆盖与分析。

1. 形态

自动语音识别(Automatic Speech Recognition,以下简称ASR) 是一种将人的语音转换为文本的技术。ASR通过将语音转化为数字信号,结合发音词典、语言模型,解码器将输入的信号匹配出对应的词串和句子。再对语音中上下文进行语义分析理解,通过卷积神经网络模型对词汇进行智能纠错。这项技术常被应用于电话客服,会议和访谈记录的语音转写。随着国内外的语音识别技术普遍趋于成熟,其已被广泛运用于金融、互联网、娱乐、智能家居等行业。

2. 招式

客户是银行最宝贵的资产,同时也是产品的试金石。通过客户的反馈,我们能够直接了解他们想法和意见,发现潜在风险。尤其是客户投诉,它不仅全面覆盖了银行业务,还以最直接的方式向内审人员揭示了银行的内外部存在的问题,为项目提供了方向和线索。但是,以往内审人员想要利用客户来电的录音数据非常困难,犹如大海捞针,原因如下:

  • 语音数据占用空间大,难以长时间保存
  • 日常语音类业务产生的音频量太大,用人工听辨的方法代价巨大、效率低下
  • 抽样检查语音记录不能系统性地、全面地提取有价值信息

ASR技术成功解决了以上难题。它通过声纹识别和语音转写两个步骤将语音转化为计算机可读的文本,并利用自然语言处理技术(Natural Language Processing,NLP)进行语义解析,例如定位内审关注主题、归纳语音对话的核心内容、提高风险识别能力等。

ASR 能够帮助内审人员对全量语音数据自动转写、分析,并提炼出有价值的信息及特定风险事件。在提升审核覆盖率的同时,还能降低人工成本、更准确地捕捉客户反馈、发现潜在的商业机会、提升客户体验。

3. 实战

银监会发布《银行业金融机构销售专区录音录像管理暂行规定》,要求银行业金融机构实施专区“双录”,即设立销售专区,并在专区内对自有理财产品及代销产品的销售过程都进行同步录音录像。 这些录音数据将有助于专项审计调查,如“自有理财及代销产品业务专项审计”中可利用投诉语音和销售语音协助调查。依照传统的内审方法,面对TB级别的语音记录,审计人员仅能对客服录音进行抽样检查,从对话中识别“自有理财及代销”主题,进而判断“误导销售或飞单”等风险事件。

相比传统内审技术而言,ASR 的审计方法大幅度缩短了核查周期。具体来说,从银行全量语音数据中逐条抽取出语音记录,声纹识别去除环境干扰并分辨出客户及员工的语音,再通过语音转写模型将语音特征参数与声学模型进行匹配,以文本形式输出客户及员工语音对话。此时,ASR 已经将语音数据转化为文本数据,后续工作就是对文本进行分析。

运用自然语言处理技术对文本检索提取到“理财亏损”、“损失本金”、“代销”等关键词,得知客户投诉内容与“理财产品销售”有关,标记该条语音为“需跟进”。对语音文本进行分析,提取这条投诉中涉及的“销售事件”、“销售时间”和“销售人员”。电话理财销售均有录音,根据销售发生的时间和销售人员获取这条理财销售的录音并转写为文本,确认了该销售人员违规对非银行产品进行代销。进而再次使用ASR将该销售人员的近两年的销售录音全部转写为文本,识别可能存在其他的违规销售情况。

4. 奥义

与传统方式相比,将ASR 应用到内部审计中的优势明显。由于分析平台可以在短时间内代替多名审计员对语音类信息进行审核,大幅度提升了审计效率。

传统内部审计抽检比例低,容易错过重要问题,难以对语音审查全面覆盖。ASR 智慧语音分析平台通过全量评估客服语音信息,可全面覆盖其中涉及的各项业务,充分利用了客户反馈中有价值的信息。

结语

传统的银行内审方式无法处理非结构化的语音类数据,大量客服语音或机器人智能问答产生的语音信息被排除在审计范围之外。应用ASR技术后,不仅将上述语音数据纳入审计范围,扩大了审计范围,同时还削减了成本。实际上,ASR 的应用不仅局限于内部审计,它已被应用在银行的商业智能分析平台上,用户可以通过发出语音指令与报表平台进行交互,调取相关报告并进行交互式分析,展示个性化的可视审计报告。ASR技术大大扩展了语音数据的应用范围,并为内部审计及其他业务领域打开了新的世界。

此内容是否提供了您需要的资讯?