R1技术
DeepSeek R1范式复现笔记
作者 | yulei自DeepSeek R1技术报告🐳开放以来,开源社区涌现了多种「复现」工作。 本R1复现笔记旨在以多个开源项目的再复现以及交叉验证为目标,探索R1/R1-zero中强化学习步骤带来的模型效果提升,并尝试展望R1技术在未来模型训练与业务落地上的前景。 一、R1 开源项目梳理目前主流的 R1 系列复现工作如表 1 所示。
2/20/2025 3:32:28 PM
腾讯技术工程
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
ChatGPT
AI绘画
AI
DeepSeek
机器人
数据
谷歌
大模型
智能
Midjourney
用户
学习
GPT
模型
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
芯片
Gemini
代码
神经网络
计算
腾讯
研究
Sora
AI设计
3D
开发者
GPU
AI for Science
英伟达
机器学习
场景
伟达
预测
华为
Transformer
模态
百度
Anthropic
驾驶
深度学习
文本
AI视频
苹果
搜索
神器推荐
算力
LLaMA
科技
视频生成
应用
xAI
干货合集
Copilot
安全
2024
字节跳动
特斯拉
具身智能
亚马逊
语音
人形机器人
视觉
AI应用场景
写作
Claude
架构