OmniTools 6月23日消息,Mistral AI 6月23日消息,公司正式发布OCR 4模型,定位为面向文档智能的最新一代OCR系统。该模型具备文本提取、边界框定位、区块类型分类(如标题、表格、公式、签名等)及逐词/逐页置信度评分能力,输出结构化结果,适用于企业搜索、RAG和领域专属检索流程。
OCR 4支持170种语言,覆盖10个语系,尤其在稀有及低资源语言上表现优于竞品;模型体积精简,可单容器部署,满足数据主权与合规要求。其API定价为每千页4美元,批量调用享50%折扣,降至2美元。
据官方披露,在OlmOCRBench基准测试中得分为85.20,位居参测模型首位;在内部Crawl Multilingual评估中达0.98,多语言性能全面领先。Mistral强调,基准分数存在局限性,建议用户结合实际文档进行验证。