OmniTools 6月22日消息,PaddleOCR 团队近日在 Hugging Face 开源最新一代通用 OCR 模型族 PP-OCRv6,提供 tiny(1.5M 参数)、small(7.7M 参数)和 medium(34.5M 参数)三个版本。其中 small 与 medium 版本支持简体中文、繁体中文、英文、日文及 46 种拉丁语系语言,共计 50 种语言。
在官方多场景基准测试中,medium 版本检测 Hmean 达 86.2%,文本识别准确率为 83.2%,较上一代 PP-OCRv5_server 分别提升 4.6 和 5.1 个百分点。
该模型采用 PPLCNetV4 统一骨干网络、RepLKFPN 检测模块及 EncoderWithLightSVTR 识别模块,兼容 PaddleOCR、Transformers 和 ONNX Runtime 等多种部署后端,开发者可直接在 Hugging Face 获取模型权重与部署指南。