MiniMax发布M3大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰

2026年06月01日 13:00
本文共计664个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

MiniMax 稀宇科技于2026年6月1日正式发布新一代前沿大模型MiniMax M3,这是国内首个集成了顶尖编程、1M超长上下文及原生多模态能力的开源大模型,旨在全面对标海外闭源旗舰。

QQ20260601-092610.jpg

针对复杂智能体任务中的上下文扩展瓶颈,M3在底层自主研发了稀疏注意力架构(MSA),相比传统方案实现更精确的KV分块与算子层优化,计算速度较同类开源方案提升4倍以上;在1M上下文下,其每Token计算量仅为上代模型的二分之一十分之一,预填与解码阶段分别实现超9倍和15倍的加速。

QQ20260601-092812.jpg

在原生百万亿量级交错数据的混合训练下,M3的语义空间高度融合,在SWE-Bench Pro等软件工程及多模态权威评测中超越GPT-5.5和Gemini3.1Pro。在极限任务实测中,M3展现出极强的长线程自主规划力,不仅历时12小时自主复现ICLR顶级论文实验,更在无参考代码下连续运行24小时、调用工具近两千次,将Hopper架构上的FP8矩阵乘硬件利用率从7.6%提升至71.3%,并在开放式PostTrainBench中自主调度模型完成“数据-训练-迭代”全流程。

伴随M3发布,专为长程复杂协作设计的MiniMax Code智能体产品与极具价格竞争力的Token Plan及API服务也同步上线,并承诺在10天内开源模型权重。MiniMax M3的推出不仅打破了前沿多模态与长上下文技术由海外闭源模型垄断的格局,更以全要素开源的形式重塑了国内开发者生态的性价比边界。

来源:MiniMax发布M3 大模型:首创MSA架构并支持1M上下文,全面开源对标海外旗舰 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/