7月3日消息,据媒体报道,在官网和开源平台GitHub上,上海国产AI独角兽MiniMax抛出全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型在权威评测榜单已位列全球开源模型第二。M1发布当天,MiniMax创始人兼CEO闫俊杰在朋友圈写下:第一次感觉到大山不是不能翻越。
M1一登场,即在权威评测榜单中位列全球开源模型第二,仅次于5月28日发布的DeepSeek-R1-0528。不过从细分项来看,M1在长文本处理、工具调用等方面形成碾压级优势。
M1支持高达100万token的上下文输入能力,相当于可以一次性处理整部《三体》英文原著,这一性能达到DeepSeek同类模型的8倍,甚至可与谷歌最新闭源模型Gemini2.5Pro相媲美。更令人瞩目的是,在保持顶尖性能的同时,其强化学习阶段仅投入53.5万美元,远低于行业常规的千万级研发成本。
MiniMax展现出惊人的研发速度和产品化能力。在M1发布后的短短四个工作日内,公司连续推出视频生成模型Hailuo 02、通用智能体MiniMax Agent、视频创作智能体Hailuo Video Agent以及音色设计工具Voice Design等多款创新产品,保持着令人瞩目的"日更"节奏。
这家扎根上海徐汇的AI企业始终保持着独特的技术路线。早在2022年底ChatGPT引发全球关注之前,MiniMax就已布局通用人工智能(AGI)领域,并果断放弃当时主流的大模型稠密架构和传统注意力机制。在全球大模型研发企业普遍收缩的行业背景下,MiniMax逆势坚持基础模型研发的战略选择,最终换来了这次具有里程碑意义的技术突破。
标签: 上海