资讯

视觉大模型评测遇挑战，首个中国古文字OCR基准开源

2026年05月19日 18:42

本文共计750个字，预计阅读时长3分钟。

来源/aibase 责编/huazi56 爱力方

顶尖的人工智能不仅要能看懂屏幕上跳动的现代代码，也需要读懂三千年前龟甲上的刻痕。据OSCHINA报道，腾讯混元大模型、SSV数字文化实验室等机构联合多所高校与故宫博物院，正式推出了“Chronicles-OCR”。这是业界首个完整覆盖汉字“七体之变”演化轨迹的中国古文字感知评测基准。

为了真实反映大模型的识别能力，该数据集由领域专家进行了多层级交叉标注，包含 2800 张严格平衡的高质量图像。针对甲骨文、金文、篆书等古早字体，团队采用了单字级的精细标注；而对于隶、楷、行、草等成熟字体，则采用了保留原始阅读顺序的序列级转写。

主流视觉模型全军覆没

项目团队基于该基准设计了四个层层递进的核心任务，严格将大模型的“视觉感知”与“语义推理”解耦开来。在对包括GPT-5、Gemini 3.1 Pro、Claude Opus 4. 7 在内的 28 个主流多模态大语言模型进行评测后，结果却令人大跌眼镜。

在面对缺乏现代版式先验的古早字体时，主流大模型在端到端检测任务中全军覆没，细粒度识别的最高准确率也仅有27.1%。令人意外的是，实验表明此时开启大模型的推理（Reasoning）模式，反而会放大感知的不确定性，导致识别表现进一步下降。

揭示微观笔画识别短板

评测还发现，在进行字体分类时，目前的视觉大模型更容易去识别载体的纹理材质，而不是去判别微观的笔画风格。这意味着今天最顶尖的AI模型，在面对中国传统古文字时，依然还远远没有做到真正的“读懂”。

汉字从殷墟甲骨一路演化至今，每一笔一画都承载着文明的连续性。Chronicles-OCR的开源不回避这一技术现实，它通过清晰可见的差距，为未来视觉大模型从简单的“识字”走向深度“读史”提供了明确的优化方向。

来源：视觉大模型遭遇滑铁卢：首个中国古文字OCR评测基准开源 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: 视觉大模型古文字OCR 评测基准开源 AI识别

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

匿名

2026-06-09

·

846 浏览
LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

匿名

2026-06-26

·

790 浏览
通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

匿名

2026-06-18

·

788 浏览
富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

匿名

2026-06-26

·

612 浏览
世界模型到底在建模什么

匿名

2026-06-29

·

560 浏览
余承东发声，鸿蒙智能将迈向Agent时代

匿名

2026-06-12

·

543 浏览

通知

尊敬的用户

user

资讯

视觉大模型评测遇挑战，首个中国古文字OCR基准开源

视觉大模型评测遇挑战，首个中国古文字OCR基准开源

相关图文

美团开源万亿参数模型LongCat-2.0，算力界的巨无霸来了

DeepSeek发表重磅论文，提出两项互补机制，大模型推理最高提速85%

千问发布原生语言世界模型 Qwen-AgentWorld 推进AI智能体进化

OpenAI启动"修补地球"计划：用AI给开源代码"打疫苗

智谱GLM-5.5预计8月发布，有望追赶全球顶尖大模型

小米开源全屋智能AI方案Miloco 2.0 让家具备记忆识人执行能力

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

Meta追加400亿美元投资其最大数据中心项目，持续加码AI基础设施

Token钱包官方网站：AI钱包开启智能消费

京东首个机器人基地在广州开工建设

微软全面引入AI挖掘Windows漏洞，后续安全补丁修复数量或将大幅增加

AI模型竞争进入成本战，OpenAI、Meta相继竞逐Token性价比

韩国明年财政支出规模拟创新高，优先支持AI、半导体等三大“超级项目”

哈工大98年教授带队，破晓智能欲将触觉融入机器人基础模型

《智能体个人信息保护自律公约》正式发布，腾讯、百度等31家企业首批签署

米哈游AI陪伴软件《BSide: Olivia Lin》开启抢先体验，支持上传MIDI生成音乐视频

讯飞医疗在上海成立新智能科技公司，注册资本1000万元

推荐专栏

爱力方

机器人大讲堂

下一篇