大模型 – 第 3 页 – 我爱自然语言处理

周二. 3 月 24th, 2026

LLm 大模型预训练模型

深度解读：DeepSeek-R1——强化学习如何重塑语言模型的推理能力？

2025年01月22号 52nlp

前两天DeepSeek发布了DeepSeek R1的报告： …

You missed

Qwen3-VL技术报告英中对照版.pdf

2025年11月29号 52nlp

DeepSeek-V3.2-Exp：用稀疏注意力实现更高效的长上下文推理

2025年09月30号 52nlp

LongCat-Flash：美团发布的高效MoE大模型，支持智能体任务，推理速度达100 token/秒

2025年09月1号 52nlp

LLm 预训练模型

GLM-4.5：三体合一的开源智能体大模型，重新定义AI推理边界

2025年08月11号 52nlp