文
张一弛
编辑
苏建勋
0年人工智能大会上,合合信息使用智能文字识别技术挑战钟鼎文识别。在没有人工干预的状态下,钟鼎文从内凹状态被拉平,并被转译成简体字,“克曰穆朕文且師華父悤譲氒心宁静于猷淑哲氒”等原本连在一起的复杂语句,也经过“AI断句”功能自动处理后被区分开来。
年合合信息正式上线扫描全能王,后者是最早将AI、OCR等技术综合运用的APP之一。通过技术迭代,扫描全能王目前印刷体文档字符平均识别率能达到99.77%,手写体文档字符平均识别率达到97.00%。
本次识别钟鼎文,是合合信息继去年在人工智能大会挑战识别甲骨文后追求的新挑战。合合信息扫描全能王事业部负责人曹超阳向36氪表示,古文的识别会涉及到OCR行业两大典型难点——图像优化处理与文字准确识别。
图像优化处理方面,古文字的载体与常规平面差异较大。甲骨文与钟鼎文对应的载体是龟壳和青铜器,表面存在不同程度弯曲、反光、凹凸不平的情况。进行文字识别前,首先需将拍摄到的图片素材进行智能图像处理,进行“拉平”等矫正工作,并排除掉阴影、噪点的干扰,达成增强图像质量的目的。
文字准确识别方面,以《桃花源记》古籍识别为例,古书的纸张比常规印刷用纸更薄,会有“毛边”、“透字”现象,对文字识别产生干扰,这时AI就需要去区分哪些是使用者需要的文字内容,遇到个别显示不清晰的文字,还要通过智能算法去理解判断这个文字是什么。
来源:采访供图,扫描全能王识别《桃花源记》
曹超阳认为,解决古文识别中面对的挑战,实质上是解决文档图像质量退化(页面不清晰)、文字检测及版面分析困难、非限定条件文字识别率低、结构化智能理解能力差等行业性难题,这些技术迭代带来的服务体验优化将更广泛地服务日常用户。
对于用户日常需求的挖掘,曹超阳表示公司十分重视用户反馈以发现产品迭代点,主要从类似场景下的用户规模以及需求底层逻辑两个方面考量。年起开始,扫描全能王发布一系列核心功能,包括“老照片修复”,“书籍扫描”,“拍PPT”等,切中了学习、生活、工作场景中被忽视的隐形需求,为公司产品商业化做好铺垫。
更多功能的迭代帮助扫描全能王在商业化道路上更进一步,扫描全能王在继续免费为用户提供内容扫描、识别解决方案的同时,将比较深入、精细的功能作为付费功能提供给用户。
近年来,因疫情影响,远程办公的需求量和需求种类迎来爆发式增长,文档数字化重新成为各界
转载请注明:http://www.0431gb208.com/sjszyzl/8884.html