LLm 大模型 预训练模型 Mistral Magistral:纯强化学习炼就的推理引擎,颠覆LLM训练范式 2025年06月11号 52nlp 无需蒸馏、抛弃SFT,Mistral用纯强化学习在数学与代码…
LLm 大模型 预训练模型 小红书dots.llm1:重新定义MoE效率边界,14B激活参数挑战72B密集模型极限 2025年06月11号 52nlp 核心突破:极简激活的超级大脑 三大技术支柱撑起SOTA表现 …