导读
OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR
短短几个月,累计Star数量已超过8.5K;
频频登上GithubTrending日榜月榜;
称它为OCR方向目前最火的repo绝对不为过;
最近,它又带来四大新发布与升级。
核心内容先睹为快:
全新发布数据合成工具Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升15%以上。全新发布半自动数据标注工具PPOCRLabel:有了它数据标注工作事半功倍,相比labelimg标注效率提升60%以上,社区小规模测试,好评如潮。多语言识别模型效果升级:在开源测试集评估,中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。PP-OCR开发体验再升级:支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。
PaddleOCR历史表现回顾
先看下PaddleOCR自去年6月开源以来,短短几个月在GitHub上的表现:
6月,8.6M超轻量模型发布,GitHubTrending全球趋势榜日榜第一。8月,开源CVPR顶会SOTA算法,再上GitHub趋势榜单!10月,发布PP-OCR算法,开源3.5M超超轻量模型,再下Paperswithcode趋势榜第一。
这个含金量,广大的GitHub开发者们自然懂,3.5M超超轻量模型的效果图大家直接看,绝对杠杠的。
火车票、表格、金属铭牌、翻转图片、外语都是妥妥的,3.5M的模型能达到这个识别精度,绝对是良心之作了!
传送门
Github:
转载请注明:http://www.0431gb208.com/sjszyzl/3265.html