返回行业动态

Mistral发布OCR 4模型,支持170种语言及结构化文档解析

2026/06/23 14:01
查看原文

OmniTools 6月23日消息,Mistral AI 6月23日消息,公司正式发布OCR 4模型,定位为面向文档智能的最新一代OCR系统。该模型具备文本提取、边界框定位、区块类型分类(如标题、表格、公式、签名等)及逐词/逐页置信度评分能力,输出结构化结果,适用于企业搜索、RAG和领域专属检索流程。

OCR 4支持170种语言,覆盖10个语系,尤其在稀有及低资源语言上表现优于竞品;模型体积精简,可单容器部署,满足数据主权与合规要求。其API定价为每千页4美元,批量调用享50%折扣,降至2美元。

据官方披露,在OlmOCRBench基准测试中得分为85.20,位居参测模型首位;在内部Crawl Multilingual评估中达0.98,多语言性能全面领先。Mistral强调,基准分数存在局限性,建议用户结合实际文档进行验证。