OmniTools 5月18日消息,PaddleOCR 3.5 正式发布,新增对 Hugging Face Transformers 作为推理后端的支持。开发者可通过设置 engine="transformers" 参数,在保持原有 OCR 与文档解析能力(如 PP-OCRv5、PaddleOCR-VL 1.5 等模型)不变的前提下,将 PaddleOCR 无缝集成至基于 Transformers 的 PyTorch 技术栈中。
该版本引入了更灵活的推理引擎接口,用户可通过 engine_config 配置 dtype、设备放置及注意力实现等后端专属选项。官方已同步上线 Hugging Face Spaces 实时演示页供快速体验。
官方强调,PaddleOCR 3.5 并非替代原有的 Paddle 静态图后端,而是提供多后端选择:对于已深度使用 Transformers 生态的 RAG、文档智能(Document AI)或 Agent 应用开发者,可显著降低集成成本;若追求极致 OCR/文档解析吞吐量,仍推荐使用默认的 paddle_static 后端。