跳至内容
周六. 12 月 6th, 2025
我爱自然语言处理
I Love Natural Language Processing
Home
AINLP
技术交流群
公开课
书籍
课程图谱
招聘求职
资源
WpMathEditor
关于
微博
分类:
大模型
LLm
大模型
预训练模型
深度解读:DeepSeek-R1——强化学习如何重塑语言模型的推理能力?
2025年01月22号
52nlp
前两天DeepSeek发布了DeepSeek R1的报告: …
文章分页
1
2
3
You missed
LLm
Qwen3-VL技术报告英中对照版.pdf
2025年11月29号
52nlp
LLm
DeepSeek-V3.2-Exp:用稀疏注意力实现更高效的长上下文推理
2025年09月30号
52nlp
LLm
大模型
LongCat-Flash:美团发布的高效MoE大模型,支持智能体任务,推理速度达100 token/秒
2025年09月1号
52nlp
LLm
预训练模型
GLM-4.5:三体合一的开源智能体大模型,重新定义AI推理边界
2025年08月11号
52nlp