跳转到主要内容

MiniMax发布新一代大模型M3 编程能力评测超越GPT-5.5

2026-06-04 14:39:47
来源
财迅通

2026年6月1日,国产大模型公司稀宇科技(MiniMax)正式发布新一代通用模型MiniMax M3。该模型采用自研稀疏注意力架构MSA,在编程能力、超长上下文及原生多模态三个方向实现同步突破。

据MiniMax官方披露,在衡量编程能力的基准测试SWE-Bench Pro上,M3取得59.0%的得分,超过了OpenAI的GPT-5.5和谷歌的Gemini 3.1 Pro,接近Anthropic的Claude Opus 4.7。在考察多模态文档解析能力的OmniDocBench测试及评估智能体能力的Claw-Eval评测中,M3均超过Gemini 3.1 Pro。

M3的核心技术突破在于其自研的稀疏注意力架构MSA(MiniMax Sparse Attention)。相较传统全注意力机制,MSA能够显著降低长上下文下的计算成本,并将上下文窗口提升至100万token。MiniMax披露,在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,prefilling阶段加速超过9倍,decoding阶段加速超过15倍。

公开资料显示,M3是国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。作为原生多模态模型,M3支持图片和视频的输入,并能操作电脑桌面,实现跨应用、跨文件、跨系统的复杂任务操作。

伴随模型发布,MiniMax同步推出了AI编程产品MiniMax Code。据官方介绍,其智能体集群可将大型任务拆解为多个可并发、可动态调整的阶段,以协作方式持续推进。在官方展示中,M3自主运行近12个小时,成功复现了一篇获奖AI论文《Learning Dynamics of LLM Finetuning》,验证了原论文提出的核心发现。

商业化方面,MiniMax同步推出Token Plan订阅方案。Plus版每月49元提供6亿token,Max版每月119元提供18亿token,Ultra版每月469元提供55亿token。API定价方面,512k上下文以内输入价格为每百万Tokens 4.2元,输出价格为每百万Tokens 16.8元。官方同步开启了为期7天的API五折优惠活动。

MiniMax表示,M3的技术报告及完整模型权重将在10天内面向全球开发者正式开源。京东云同日宣布,其JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并开放服务。

关键词
关联公司