01
应用背景
华夏金融租赁有限公司始终秉承“价值、责任、专业、创新”的企业文化理念,积极践行社会责任,紧跟国家宏观政策和产业政策,在积极服务实体经济的同时,持续深化绿色租赁业务特色。在新能源、节能环保、固废处理、公用事业等领域培育了较为稳固的客户群,在文化旅游、远洋渔业、工业转型、特色小镇、传统产业升级改造、IDC等行业取得了积极进展。
年,公司积极贯彻绿色新发展理念,助力“双碳”目标和乡村振兴战略,促进公司零售租赁业务转型,创新推出分布式户用光伏租赁业务,并积极应用大数据、人工智能等金融科技自主研发了“分布式户用光伏管理系统”,构建了以在线营销、智能风控、数字化租后管理为核心的全流程线上化租赁业务处理平台。截止年3月,已服务于全国余个乡村共计8万余户农户。
鉴于户用光伏租赁业务客户数量多,分布区域广,各地电网公司并网合同制式不同等实际情况,传统的人工处理、审核方式,已无法适应业务发展需要。因此,公司在户用光伏系统研发时,应用当前业界先进的自然语言处理(NaturalLanguageProcessing,NLP)技术,进行了相关模块的优化开发,极大提升了电站并网的合同处理效率。
02
业务痛点分析
户用光伏电站建成完工后,需完成并入国家电网流程,农户需与当地国家电网公司签署电站并网合同,业务开展中主要面临以下几方面问题:
(一)合同制式不同
各地方区域国家电网公司关于户用光伏发电项目有不同的合同制式模板,合同条款内容、排版布局等都不尽相同,目前公司户用光伏业务已拓展至全国近多个区县余乡村,需要处理的合同制式版本有近种,对合同审核工作构成很大的挑战。
(二)合同填写不规范
在光伏电站并网阶段,客户签署电站并网合同的方式也不尽相同,有的农户采用Word输入并打印方式,有的农户采用人工手写方式,不同的合同填写方式,极大影响后台部门对合同文本审核工作的效率。
(三)人工录入工作量大
农户与当地国网公司签署电站并网合同后,由业务人员上传至系统后台,后台相关人员需要将每份合同文本的相关条款内容录入系统归档,对于不同地区不同制式合同,且有不同的填写方式(机打、手写),后台相关人员录入工作量巨大。
(四)人工审查效率低
农户与当地国网公司签署电站并网合同后,后台法务合规人员,需比对各合同文本内容与业务人员录入的相关重要信息进行审核,通过后方可流转后续流程,人工审核效率低下。
03
NLP解决方案
基于以上几方面的问题分析,公司积极研究关于此类业务场景的应用解决方案,引入自然语言处理(NaturalLanguageProcessing,NLP)技术,以解决户用光伏系统电站并网合同文本处理的相关问题。
自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,目前主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。运用自然语言处理技术,可以解决公司户用光伏业务面临的合同录入、合同识别、合同审核等签署难题,同时,还可以作为公司基础公共应用技术逐渐扩展到其他应用场景。在户用光伏系统的NLP应用实践中,主要进行了以下方面工作:
(一)搭建NLP文档识别系统
自然语言处理(NLP)技术是机器学习的三大应用领域之一(视觉处理、语音处理、自然语言处理),因此NLP的核心是机器学习,机器学习的核心是在大数据中进行知识发现,并找出规律。为此,我们搭建了NLP文档训练平台,通过标注全国已拓展户用光伏业务地区的不同合同文本模板,构建户用光伏系统并网合同文本识别模型的训练数据集和验证集,通过不断的调试和优化,得到目前较为合适的识别模型,并在指定的测试数据集上达成较好的误差容错率。
(二)自动抽取标注字段,辅助录入系统
农户签署光伏电站并网合同文本,扫描图片上传至后台系统,NLP文档识别系统根据合同文本识别模型,自动抽取模型已标注字段(如:承租人、电站地址、身份证号、电费结算账户等),系统自动识别并提取字段文字,辅助业务人员快速录入表单,减少了将合同信息录入系统的工作量。
(三)自动比对数据差异,合同审核预警提醒
当流程流转至放款审核环节,后台审核人员需要对电站并网合同进行人工审核,自然语言处理(NLP)技术根据合同文本自动识别结果与业务人员进件录入信息自动比对,未匹配的信息,系统将高亮警告,方便审核人员聚焦审核重点,提升审核效率和审核质量。
04
应用效果分析
户用光伏系统接入NLP文档识别能力后,极大提升了相关业务人员和审核人员的工作效率,目前累计已处理近8万余份合同文本,识别成功率达80%,业务人员无需将精力投入在大量的系统录入工作,之前每业务员仅能处理60笔合同/天,现可处理余笔/天,同时业务员可更
转载请注明:http://www.0431gb208.com/sjsbszl/205.html