资讯

MiniMax M3即将发布：稀疏注意力架构突破百万Token上下文效率显著提升

2026年05月27日 14:19

本文共计756个字，预计阅读时长3分钟。

来源/aibase 责编/huazi56 爱力方

AIbase 报道 北京时间最新消息，国内 AI 独角兽 MiniMax 即将推出新一代大模型 M3。MiniMax AI 工程负责人 Skyler Miao 近日在社交平台释放预告，称“Something BIG is coming!”，引发业界广泛关注。

M3核心架构创新:稀疏注意力机制

据透露，M3采用了全新稀疏注意力（Sparse Attention）架构，通过 Index Branch 快速索引与 Sparse Branch 精准计算相结合的方式，有效解决了超长上下文场景下的计算瓶颈。

传统 Transformer 在处理百万 Token 级别上下文时，计算量会随序列长度呈平方级增长。而 M3的稀疏设计能大幅降低这一开销，在保持高性能的同时实现显著的效率跃升，为长文本理解、长对话、多文档分析等应用场景提供有力支撑。

实测性能大幅领先 M2

对比前代 M2（支持1M Token 上下文），M3在关键指标上取得突破性提升:

Prefill 阶段速度提升9.7倍
Decoding 阶段速度提升15.6倍

这意味着在实际部署中，M3能够以极低的算力成本高效处理超长上下文，显著降低推理成本，并为更复杂的 AI 应用打开想象空间。

行业意义:长上下文时代的效率新标杆

MiniMax 此次 M3的预告再次凸显了国内 AI 企业在架构创新上的竞争力。稀疏注意力等技术的突破，有望推动大模型从“参数规模竞赛”转向“效率与实用性竞赛”，为企业级落地和消费者应用带来更实惠、高效的体验。

目前 MiniMax 尚未公布 M3的具体发布时间与完整参数规模，但从工程负责人的预告及性能数据来看，这款模型有望成为长上下文处理领域的有力竞争者。AIbase 将持续关注 MiniMax M3的后续动态，第一时间带来最新报道。

来源：重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增 | AIbase

声明：本文来自aibase，版权归作者所有。文章内容仅代表作者独立观点，不代表爱力方立场，转载目的在于传递更多信息。如有侵权，请联系 copyright#agent.ren。

TAGS: MiniMax M3 稀疏注意力长上下文效率

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

匿名

2026-06-09

·

846 浏览
LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

匿名

2026-06-26

·

790 浏览
通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

匿名

2026-06-18

·

788 浏览
富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

匿名

2026-06-26

·

612 浏览
世界模型到底在建模什么

匿名

2026-06-29

·

560 浏览
余承东发声，鸿蒙智能将迈向Agent时代

匿名

2026-06-12

·

543 浏览

通知

尊敬的用户

user

资讯

MiniMax M3即将发布：稀疏注意力架构突破百万Token上下文效率显著提升

M3核心架构创新:稀疏注意力机制

实测性能大幅领先 M2

行业意义:长上下文时代的效率新标杆

相关图文

小红书开源 RedKnot 推理引擎，长上下文处理效率翻倍，助力告别“长文本焦虑”

MiniMax宣布6亿港元全员激励计划提振团队信心

MiniMax 7月9日将迎首批解禁阿里、米哈游明确表示不减持

支付宝新产品Token Pay，首接最新国产大模型MiniMax M3

MiniMax陷入增长困境：涨价、解禁与市场信任的风暴

美股超级IPO改变MiniMax和智谱的估值锚

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

Meta新AI图像功能因争议下线

两家大模型公司前后脚发布内部信：智谱创始人提出未来两年“摸高计划”，MiniMax创始人宣布暂停自己薪酬

20-30万增程插混轿车三电、底盘、智驾、座舱全方位对比

人形机器人正迎来自己的iPhone时刻

特写｜机器人来到古村落_中国政库

蚂蚁灵波四天六发为机器人装上原生大脑

光合组织智能计算应用大会：国内首个全国产十万卡AI超集群落地，海光信息宣布进军嵌入式AI市场

博主发AI台风预报系违法，人民锐评：灾害预警绝不容许被当牟利工具

AI热潮推动下，业内人士称HBM4价格明年或将翻倍

LEAP East 2026观察：九章云极提出AI公共设施时代已至，机器流量冰山凸显万亿算力变局

推荐专栏

爱力方

机器人大讲堂

下一篇

user

资讯

MiniMax M3即将发布：稀疏注意力架构突破 百万Token上下文效率显著提升

M3核心架构创新:稀疏注意力机制

实测性能大幅领先 M2

行业意义:长上下文时代的效率新标杆

相关图文

小红书开源 RedKnot 推理引擎，长上下文处理效率翻倍，助力告别“长文本焦虑”

MiniMax宣布6亿港元全员激励计划提振团队信心

MiniMax 7月9日将迎首批解禁 阿里、米哈游明确表示不减持

支付宝新产品Token Pay，首接最新国产大模型MiniMax M3

MiniMax陷入增长困境：涨价、解禁与市场信任的风暴

美股超级IPO改变MiniMax和智谱的估值锚

热门资讯

微软开源项目遭黑客入侵，多款AI开发工具被植入密码窃取软件

LabVLA：浙大与上海AI Lab联合探索科学具身智能，推动AI进入实验室

通义实验室联合开源首个统一科学大模型LOGOS，1B参数性能超越NatureLM

富士通推出PHOTON新架构，性能提升475倍以应对AI算力瓶颈

世界模型到底在建模什么

余承东发声，鸿蒙智能将迈向Agent时代

快讯

Meta新AI图像功能因争议下线

两家大模型公司前后脚发布内部信：智谱创始人提出未来两年“摸高计划”，MiniMax创始人宣布暂停自己薪酬

20-30万增程插混轿车三电、底盘、智驾、座舱全方位对比

人形机器人正迎来自己的iPhone时刻

特写｜机器人来到古村落_中国政库

蚂蚁灵波四天六发 为机器人装上原生大脑

光合组织智能计算应用大会：国内首个全国产十万卡AI超集群落地，海光信息宣布进军嵌入式AI市场

博主发AI台风预报系违法，人民锐评：灾害预警绝不容许被当牟利工具

AI热潮推动下，业内人士称HBM4价格明年或将翻倍

LEAP East 2026观察：九章云极提出AI公共设施时代已至，机器流量冰山凸显万亿算力变局

推荐专栏

爱力方

机器人大讲堂

下一篇

MiniMax M3即将发布：稀疏注意力架构突破百万Token上下文效率显著提升

MiniMax 7月9日将迎首批解禁阿里、米哈游明确表示不减持

蚂蚁灵波四天六发为机器人装上原生大脑