Mistral AI 发布 OCR4 模型:支持 170 种语言,输出质量超越 GPT 与 Gemini

2026年06月26日 13:48
本文共计529个字,预计阅读时长2分钟。
来源/aibase 责编/XingzheWujiang 行者无疆

法国人工智能初创企业Mistral AI于本月 23 日正式推出最新文档内容识别模型OCR 4,在光学字符识别领域投下一枚重磅炸弹。这款小型聚焦模型支持横跨 10 个语族的多达 170 种语言,在权威基准测试OmniDocBench中斩获93. 07 分,输出质量相较GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手更受人类评审青睐。

image.png

小型但全面,覆盖多场景下游任务

OCR4 的定位并非追求参数规模,而是一个专精于文档识别的高效模型。它在输出识别文本的同时还能提供边框定位、区域分类及置信度评分,可广泛支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等多种下游工作负载。

定价方面,OCR4 基础API调用为每千页 4 美元,若采用批处理方式可享受50%的折扣;而文档人工智能定价则为每千页 5 美元。

Mistral AI作为欧洲AI领域最具代表性的初创公司之一,此前已凭借开源与闭源并行的模型策略在全球市场崭露头角。此次推出OCR 4,将公司能力从通用大语言模型进一步延伸至文档智能处理这一垂直赛道,直接与OpenAI、Google等巨头在基础工具层展开竞争。

来源:Mistral AI发布OCR4 模型:支持 170 种语言,输出质量超越GPT与Gemini | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/