资讯

百度开源3B模型Unlimited OCR：5天Star破万，刷新长文档解析纪录

2026年06月29日 15:36

本文共计447个字，预计阅读时长2分钟。

来源/aibase 责编/Zhuangdian 妆点人生

百度近日发布并开源了3B参数规模的端到端OCR模型——Unlimited OCR，专为书籍、论文等长文档解析场景打造。该项目上线后迅速登顶GitHub与HuggingFace四项趋势榜，开源仅5天GitHub Star即破万。

技术上，Unlimited OCR推理时激活参数约570M，并首次引入Reference Sliding Window Attention（R-SWA）机制。该机制打破了传统“逐页解析+拼接”的限制，实现数十页文档的一次性连续解析;同时，它将解码阶段的KV Cache控制在恒定规模，使显存占用和计算成本不再随输出长度增长而暴涨。

在OmniDocBench v1.6基准测试中，该模型以93.92%的成绩刷新纪录。真实场景下，其推理速度较DeepSeek OCR提升约12.7%，在6000Tokens输出长度下速度优势扩大至35%，为海量文档数字化和大模型长程记忆管理提供了全新路径。

来源：百度开源3B模型Unlimited OCR:5天Star破万，刷新长文档解析纪录 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

0

0

TAGS: 百度开源 UnlimitedOCR 长文档解析 R-SWA OCR模型

相关图文

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

匿名

2026-06-09

·

846 浏览
LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

匿名

2026-06-26

·

790 浏览
通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

匿名

2026-06-18

·

788 浏览
富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

匿名

2026-06-26

·

612 浏览
余承东发声，鸿蒙智能将迈向Agent时代

匿名

2026-06-12

·

543 浏览
火山引擎发布豆包Seedance2.5视频模型，方舟大模型服务用户超110万

匿名

2026-06-23

·

540 浏览

快讯

部分用户使用人工智能被“幻觉”误导专家建议厘清多重责任边界补上合规使用必修课

2026-06-29

·

0 浏览

国际清算银行称中东战事对全球经济影响或持续存在

2026-06-29

·

0 浏览

模型变小，能力不减：新浪VibeThinker-3B开源，AI推理迎来轻量化新思路

2026-06-29

·

0 浏览

中医AI四诊仪赛道百家竞逐，知医邦四诊仪凭何脱颖而出？

2026-06-29

·

0 浏览

数创弧光增资至约395万，增幅约12%

2026-06-29

·

0 浏览

三星正式宣布2655万亿韩元投资计划，涉及半导体、AI算力数据中心等领域

2026-06-29

·

0 浏览

不再只是会走路的双臂平台：OpenHLM解放人形机器人全身移动操作能力

2026-06-29

·

0 浏览

OceanBase发布湖库一体AI数据库，让Agent真正读懂企业

2026-06-29

·

0 浏览

无界动力发布MWA隐空间世界模型，此前融资数亿美元并登顶权威榜单

2026-06-29

·

0 浏览

蚂蚁阿福公布减重1亿斤进展：目前已瘦10万斤网友自嘲我又拖后腿了

2026-06-29

·

0 浏览

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读

机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台

关注爱力方，掌握前沿具身智能动态

© 2025 爱力方

https://www.agentren.cn/

浙ICP备2025176963号-3

标签云 RSS订阅滚动资讯资讯排行

下一篇

已是最新内容。