如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-18 01:20:11

卷起来了呀,MiniMax也玩起了开源周,哈哈哈哈,这是对标DeepSeek开源周的节奏呀! 先***地期待一手,不知道后面四天都会有什么内容,不过,现在大模型厂真的卷到飞起了! Day1,MiniMax 是先开源了混合注意力推理模型-M1,这个模型是在今年1月份开源的MiniMax-Text-01模型上增量训练得来的,结构跟MiniMax-Text-01模型一致,MoE结构,总参数456B,激活参数45.9B。

Paper:***s://github***/MiniMax-AI/MiniMax-M1/blob/main/…。

如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?
广告位810*200
相关阅读
华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒?

华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒?

怎么说呢,买华为旗舰系列的,一定是不是特别注重处理器性能的,...

2025-06-20
既然C#等开源语言,为啥***le还要弄个基本上一模一样的Swift?

既然C#等开源语言,为啥***le还要弄个基本上一模一样的Swift?

现代编程语言里swift是独一份默认所有class都是引用计...

2025-06-20
你见过最人性化的设计是什么?

你见过最人性化的设计是什么?

最近北京、上海、西安、哈尔滨等地兴起一种名为“***装上班”...

2025-06-20
你能用一句话总结赵本山和郭德纲的区别吗?

你能用一句话总结赵本山和郭德纲的区别吗?

宋小宝在某音直播,去本山家吃饭。 本山说:“有新下的大酱,...

2025-06-20
台湾人对南京人有特殊情结吗?

台湾人对南京人有特殊情结吗?

大部分時候沒有,只有少數時刻,比如上次我參訪了南京的總統府,...

2025-06-20