发布时间:2026-06-24 已有: 位 网友关注
币界网消息,Mistral AI宣布推出文档智能理解模型OCR 4。该模型突破了传统OCR仅提取扁平文本的限制,能够输出包含包围框、元素分类以及词级和页级置信度评分的结构化文档数据。模型支持170种语言,在低资源及稀有语言上表现出极强的准确性,并兼容PDF、DOC、PPT等主流企业格式。为了满足企业对数据隐私和主权的要求,OCR 4支持单容器的自托管部署。在盲测人类偏好评估中,OCR 4较主流同类系统录得72%的平均胜率,并在公开基准测试OLMOCRBench上取得85.20的最高分。早期企业用户反馈,在金融问答等密集图表场景中,OCR 4的精度可媲美前沿Agentic解析器,而成本和延迟分别降低了8倍与17倍。