毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

人工智能技术在档案OCR工作中的应用四

来源:语言识别 时间:2022/10/5
北京治好白癜风要多少钱 https://wapjbk.39.net/yiyuanfengcai/zn_bjzkbdfyy/

基于人工智能技术的OCR

近年来,随着计算机视觉、自然语言理解、知识图谱等人工智能技术在OCR中的实际使用,OCR的性能和效率都得到了很大提升。通过深度学习的自适应学习驱动方式,能够更好地应对传统OCR产生的一些问题,简化参数预处理的流程,实现端到端的处理,提高OCR识别率。目前,基于人工智能技术的OCR在简体印刷文字方面的识别率已达98%以上。

人工智能OCR技术还能应用于具有多样性和复杂性的识别场景。如,不同大小、字体、颜色、亮度、对比度的文字,排列和对齐方式不相同的文字,图像的非文字区域与文字区域存在相似的纹理,低对比度、模糊断裂、残缺文字等。因此,人工智能OCR不仅能应用于文档的识别,还可应用于自然场景文字图像的识别。此外,人工智能OCR还能提高工作效率、节省大量成本。

基于此,将人工智能OCR应用在档案工作中,具有重要的作用和意义,必将成为支撑档案行业数字转型、智能升级、融合创新的重要基础。

人工智能OCR工作流程主要包括图像输入、文本检测、文本识别、人工确认、人工干预等。

首先,将需要识别的纸质档案数字化副本图像单个或批量导入OCR系统中。

其次,进行文本检测。文本检测主要是定位文字在数字图像中的位置,并进行位置标注。文本检测的方法主要有基于候选框的文本检测、基于语义分割的文本检测,以及基于两种方法的混合方法等。基于候选框的文本检测是先预生成若干候选框,之后再回归坐标和分类,最后经过NMS(非极大抑制)算法得到最终的检测结果;基于语义分割的文本检测是通过FPN(特征金字塔网络)直接进行像素级别的语义分割,并处理得到相关的坐标。

声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱

转载请注明:http://www.0431gb208.com/sjsbszl/1839.html