霸榜Github又一款OCR神器面世

来源：语言识别时间：2023/2/8

导读

OCR方向的工程师，一定需要知道这个OCR开源项目：PaddleOCR

短短几个月，累计Star数量已超过8.5K；

频频登上GithubTrending日榜月榜；

称它为OCR方向目前最火的repo绝对不为过；

最近，它又带来四大新发布与升级。

核心内容先睹为快：

全新发布数据合成工具Style-Text：可以批量合成大量与目标场景类似的图像，在多个场景验证，效果均提升15%以上。全新发布半自动数据标注工具PPOCRLabel：有了它数据标注工作事半功倍，相比labelimg标注效率提升60%以上，社区小规模测试，好评如潮。多语言识别模型效果升级：在开源测试集评估，中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。PP-OCR开发体验再升级：支持动态图开发（训练调试更方便），静态图部署（预测效率更高），鱼与熊掌可以兼得。

PaddleOCR历史表现回顾

先看下PaddleOCR自去年6月开源以来，短短几个月在GitHub上的表现：

6月，8.6M超轻量模型发布，GitHubTrending全球趋势榜日榜第一。8月，开源CVPR顶会SOTA算法，再上GitHub趋势榜单！10月，发布PP-OCR算法，开源3.5M超超轻量模型，再下Paperswithcode趋势榜第一。

这个含金量，广大的GitHub开发者们自然懂，3.5M超超轻量模型的效果图大家直接看，绝对杠杠的。

火车票、表格、金属铭牌、翻转图片、外语都是妥妥的，3.5M的模型能达到这个识别精度，绝对是良心之作了！

传送门

Github：

转载请注明：http://www.0431gb208.com/sjszyzl/3265.html

上一篇文章：第一篇程序与算法

下一篇文章：没有了