LLm 大模型 预训练模型 Mistral Magistral:纯强化学习炼就的推理引擎,颠覆LLM训练范式 2025年06月11号 52nlp 无需蒸馏、抛弃SFT,Mistral用纯强化学习在数学与代码…
LLm 大模型 预训练模型 小红书dots.llm1:重新定义MoE效率边界,14B激活参数挑战72B密集模型极限 2025年06月11号 52nlp 核心突破:极简激活的超级大脑 三大技术支柱撑起SOTA表现 …
LLm 大模型 语言模型 预训练模型 QwenLong-L1:通过强化学习实现长上下文推理的大模型飞跃 2025年05月27号 52nlp 近年来,大型推理模型(Large Reasoning Mod…
LLm 大模型 预训练模型 深度解析DeepSeek-V3:硬件与模型协同设计如何突破LLM规模化瓶颈 2025年05月15号 52nlp 就在今天,梁文锋署名DeepSeek新论文的刚刚放出,以下是…