MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

2026年05月27日 14:43

本文共计1276个字，预计阅读时长5分钟。

来源/aibase 责编/huazi56 爱力方

5月11日，面壁智能联合清华大学及 OpenBMB 开源社区，正式发布新一代端侧多模态大模型 MiniCPM-V4.6。这款仅拥有1.3B 参数的“轻量级”模型，凭借极致的智能密度与跨平台适配能力，成功挑战了更大参数模型的性能天花板，为端侧 AI 的落地应用按下了“加速键”。

一、性能巅峰:1.3B 参数下的“越级表现”

MiniCPM-V4.6推出了 Instruct 与 Thinking 两个版本，在多项评测中展现出同量级模型难以企及的推理与理解能力:

全球领跑: 在 Artificial Analysis（AA）榜单中，MiniCPM-V4.6以 13分 的优异成绩，不仅大幅领先同尺寸竞品（如阿里 Qwen3.5-0.8B 和谷歌 Gemma4-E2B-it），性能更直逼更大参数的 Qwen3.5-2B，成为1B 级模型中的性能标杆。
高阶能力: 无论是通用图文理解、复杂的 STEM 数理推理，还是极具挑战的文档 OCR 与视频时序理解，模型表现均表现出极高的智能水准。特别是在多图像推理与幻觉抑制方面，Thinking 版表现尤为出色。

二、效率革命:极致的端侧“智能密度”

为了解决端侧部署“内存焦虑”，MiniCPM-V4.6在推理速度与资源占用上进行了深度优化:

极速门槛: 运行内存需求被压缩至 6GB，使得主流智能手机、PC 及智能家居设备均能流畅运行。
推理效率: 基于 vLLM 的推理吞吐量达到竞品的1.5倍;在端侧处理3136² 超高清大图时，首响延迟仅 75.7ms，较竞品快出2.2倍。
吞吐能力: 单卡即可实现7013token/s 的文本生成能力，以及54.79张/秒的1344² 图片处理能力，效率表现惊人。

三、技术硬核:LLaVA-UHD v4带来的开销缩减

模型之所以能“轻装上阵”，离不开面壁智能与清华大学联合研发的 LLaVA-UHD v4 技术:

编码重构: 通过重构 ViT 图像编码与浅层压缩模块，图像编码开销降低了 50%，高分辨率浮点运算减少 55.8%。
混合压缩机制: 创新支持4倍/16倍混合 Token 压缩，支持模型在“性能优先”与“速度优先”之间灵活切换，该技术此前已在快手的推荐大模型 OneRec 中经过验证，支撑了海量流量请求。

四、生态落地:从实验室走向产业一线

MiniCPM-V4.6的开源不仅是技术的胜利，更是生态的胜利:

开发便捷: 深度适配 ms-swift、LLaMA-Factory 等微调框架，开发者单张 RTX4090显卡即可实现全量微调。
全平台兼容: 支持 vLLM、Ollama 等主流框架，并提供覆盖 iOS、Android、HarmonyOS 的测试版本，让 AI 触达更多形态的硬件终端。
落地赋能: 目前该系列已在汽车、PC、智能家居及工业检测等多领域落地，合作伙伴涵盖联想、吉利、上汽大众、小米、OPPO 等行业头部企业。

随着 MiniCPM-V4.6的全面开源，端侧多模态大模型的门槛已被彻底拉平。未来，AI 将不再仅仅依赖云端算力，而是真正融入每一个智能终端，成为个人日常生活中不可或缺的“智慧大脑”。

来源：1.3B 模型的“降维打击”：MiniCPM-V 4.6 重新定义端侧多模态巅峰 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

通知

尊敬的用户

user

资讯

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

一、性能巅峰:1.3B 参数下的“越级表现”

二、效率革命:极致的端侧“智能密度”

三、技术硬核:LLaVA-UHD v4带来的开销缩减

四、生态落地:从实验室走向产业一线

相关图文

孙天祥正式加盟百度，出任基础模型研发部负责人并加入模型委员会

三年蛰伏匿名杀入全球前三，美团龙猫2.0能否改写万亿参数国产算力新叙事？

DeepSeek V4下月上线将引入峰谷定价机制

美团开源万亿参数模型LongCat-2.0，算力界的巨无霸来了

马斯克宣布每月推出全新大模型 Grok 4.5 内测性能比肩 Claude Opus

智达明远AI刘艳兵受邀出席2026火山引擎FORCE原动力开发者大会，借力顶级AI生态盛宴共探产业落地新范式

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

新产品配套英伟达产业链液冷概念股3天2板本周机构密集调研相关上市公司

2026世界人工智能大会期间，上海部分道路和区域将实施交通管制

上海发布两项通告加强2026世界人工智能大会安全管理

人民锐评：AI智能荐股？投资没有一键致富！

手机成为大模型竞争新赛场 AI超级载体利好哪些硬件环节

周末要闻 | 国常会要求加快新一代通信网和算力网建设

白林松：当世界聚焦“规模化创新”，创意科技正把AI带入物理世界

中国第二届“绿色光疗·孝爱同行”健康发展大会暨康企集团七周年AI健康公益盛典圆满落幕

30万内智驾SUV横评：四款车功能体验落差谁最小？

碳达峰行动方案正式落地：数据中心与AI基建纳入控碳版图

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

MiniCPM-V 4.6 重新定义端侧多模态巅峰，搭载1.3B模型

一、性能巅峰:1.3B 参数下的“越级表现”

二、效率革命:极致的端侧“智能密度”

三、技术硬核:LLaVA-UHD v4带来的开销缩减

四、生态落地:从实验室走向产业一线

相关图文

孙天祥正式加盟百度，出任基础模型研发部负责人并加入模型委员会

三年蛰伏匿名杀入全球前三，美团龙猫2.0能否改写万亿参数国产算力新叙事？

DeepSeek V4下月上线将引入峰谷定价机制

美团开源万亿参数模型LongCat-2.0，算力界的巨无霸来了

马斯克宣布每月推出全新大模型 Grok 4.5 内测性能比肩 Claude Opus

智达明远AI刘艳兵受邀出席2026火山引擎FORCE原动力开发者大会，借力顶级AI生态盛宴共探产业落地新范式

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

新产品配套英伟达产业链 液冷概念股3天2板 本周机构密集调研相关上市公司

2026世界人工智能大会期间，上海部分道路和区域将实施交通管制

上海发布两项通告 加强2026世界人工智能大会安全管理

人民锐评：AI智能荐股？投资没有一键致富！

手机成为大模型竞争新赛场 AI超级载体利好哪些硬件环节

周末要闻 | 国常会要求加快新一代通信网和算力网建设

白林松：当世界聚焦“规模化创新”，创意科技正把AI带入物理世界

中国第二届“绿色光疗·孝爱同行”健康发展大会暨康企集团七周年AI健康公益盛典圆满落幕

30万内智驾SUV横评：四款车功能体验落差谁最小？

碳达峰行动方案正式落地：数据中心与AI基建纳入控碳版图

推荐专栏

爱力方

机器人大讲堂

下一篇

新产品配套英伟达产业链液冷概念股3天2板本周机构密集调研相关上市公司

上海发布两项通告加强2026世界人工智能大会安全管理