首页
版块
搜索
注册
登录
train-deepseek-r1
宝藏资源
收藏
回帖
github.com
新手上路
3小时前
主楼
[资源名称]
train-deepseek-r1
[资源来源]
github.com
[资源介绍]
train-deepseek-r1 一个从零实现 DeepSeek R1 训练过程的开源项目,通过手绘流程图和代码解析展示训练流程,包含GRPO算法、SFT及推理导向强化学习实现,采用小型基础模型支持本地训练。
[资源合集]
开源软件宝典!总有一款软件值得你收藏使用!
回复
点赞
举报
😀
😊
😵💫
😡
🤝
🙏
👍
👎
❤️
回复