数据获取的相关技术—自然语言处理
自然语言处理(NaturalLanguageProcessing,NLP)是研究如何让计算机理解并生成人类自然语言的一种技术。在RPA的应用过程中,NLP的应用场景主要有以下几种情况。
当机器人接收到的要处理的信息不是结构化字段,也不是待OCR处理的扫描图像,而是一段人类自然语言表达的文字时,这就需要NLP从中提取出关键的字段信息,然后自动录入系统或者与系统中的信息做比对。
在OCR技术识别完信息之后,NLP技术可用来做优化处理,在识别完的文字中找出最合乎逻辑的词,做出文字修正。
当需要处理大量信息时,RPA可以利用NLP进行检索或分类处理。
NLP技术可以在RPA处理完成以后以自然语言的方式反馈给用户。
NLP由两项主要技术完成,包括自然语言理解和自然语言生成。
自然语言理解
自然语言理解的主要目标是帮助机器更好地理解人的语言。
自然语言生成
自然语言生成的主要目标是帮助机器生成人类能够理解的语言。
NLP是典型受制于语言特性的一项技术,如由于中文和英文在用词和语法的差异,造成NLP所使用的算法技术具有很大差异。
在自动化应用领域,NLP一方面配合RPA来使用,另一方面也可以配合OCR来使用,协助提高文字识别率。例如,银行信用卡中心的RPA客服机器人收到这样的一份客户请求,“明天,请将我的个人信用卡额度多调整1万元”,这句话是不能被机器人所理解的,需要借助NLP。机器人结合领域知识将句子转换为业务信息,时间(Daytime)是“明天”,即“计算机获取的今天日期+1”,假设得到明天的日期是“-11-20”;主语是“信用卡”;定语是“我的”,依据客户的请求来源可以得到CustomerID,再依据CustomerID查询该客户名下拥有的信用卡(CardNo);动作(Action)是“额度调整”;金额(Amount)是“1万元”。
通过这样的处理后,机器人获得的信息就变成了{CustomerID:XXXXXX
CardNo:XXXX-XXXX-XXX
Action:CreditLimitAdjustment
Amount:10,RMB
Daytime:-11-20},然后按照对应的动作自动打开相应的界面,直接录入相关信息进行操作。当然,机器人可能接收到的信息是“从明天起,我的信用卡额度增加1万元”或“我的信用卡额度从明天起请求提升1万元”,但是这样的话术调整,并不会影响处理结果。这只是一个较为简单的示例,真实的自然语言理解具有的难度更大,因为自然语言包含大量的口语语言现象,如省略、指代、更正、重复、强调、倒序等,所以中文的NLP仍然被公认为是最难的。
但是我们必须澄清一点,RPA的应用领域主要是在商业环境中的业务办理环节,话术是相对规范和标准的,而且范围也是相对狭窄和明确的。为了配合RPA的使用企业也可以从管理角度规范双方沟通的话术。
转载请注明:http://www.0431gb208.com/sjszlfa/1238.html