LLm 大模型 预训练模型 MiniMax-M1:闪电注意力重塑大模型推理效率,百万上下文时代来临,附技术报告英中对照版 2025年07月3号 52nlp 一、核心创新:闪电注意力 + 混合架构 1. 闪电注意力(L…