DeepSeek R1微调与模型训练实战教程
讲师/助教:
,
促销:
首单领券满50减10!满100减20!
总时长:
7小时8分51秒
价格:134.5
目录
- 01-deepseek R1 简介
- 02.1-deepseek R1 问答微调整体框架
- 02.2-deepseek R1 问答微调 数据集加载
- 02.3-deepseek R1 问答微调 模型加载
- 02.4-deepseek R1 问答微调 tokenizer
- 02.5-deepseek R1 问答微调 模型输出
- 02.6-deepseek R1 问答微调 evaluation callcallback
- 02.7-deepseek R1 问答微调 lora 配置
- 02.8-deepseek R1 问答微调 SFTCONFIG
- 02.9-deepseek R1 问答微调 tensorboard
- 02.10-deepseek R1 问答微调 trainer
- 02.11-deepseek R1 问答微调 加载微调过的模型
- 02.12-deepseek R1 问答微调 合并模型
- 02.13-deepseek R1 问答微调 测试模型
- 02.14-deepseek R1 问答微调 gpu
- 03.1-deepseek R1 思维链微调 整体介绍
- 03.2-deepseek R1 思维链微调 数据集讲解
- 03.3-deepseek R1 思维链微调 模型加载
- 03.4-deepseek R1 思维链微调 tokenizer
- 03.5-deepseek R1 思维链微调 配置和训练
- 04.1-蒸馏Qwen至deepseek R1- Qwen0.5B 模型
- 04.2-蒸馏Qwen至deepseek R1- deepseek 1.5B
- 04.3-蒸馏Qwen至deepseek R1-数据处理
- 04.4-蒸馏Qwen至deepseek R1-蒸馏
- 05.1-deepseek R1 论文精读-介绍
- 05.2-deepseek R1 论文精读-贡献
- 05.3-deepseek R1 论文精读-deepseekR1-Zero 训练方法
- 05.4-deepseek R1 论文精读-deepseekR1 训练方法
- 05.5-deepseek R1 论文精读-deepseekR1 讨论
- 06.1-微调基础知识补充-01
- 06.1-微调基础知识补充-02