全部创建

knox / LLaMA-Factory-2.md

最后活跃于 1728786012

LLaMA-Factory-2.md · 1.1 KiB · Markdown 原始文件

Approach
Full-tuning
Freeze-tuning
LoRA
QLoRA


Pre-Training
✅
✅
✅
✅

Supervised Fine-Tuning
✅
✅
✅
✅

Reward Modeling
✅
✅
✅
✅

PPO Training
✅
✅
✅
✅

DPO Training
✅
✅
✅
✅

KTO Training
✅
✅
✅
✅

ORPO Training
✅
✅
✅
✅

SimPO Training
✅
✅
✅
✅

Approach	Full-tuning	Freeze-tuning	LoRA	QLoRA
Pre-Training	✅	✅	✅	✅
Supervised Fine-Tuning	✅	✅	✅	✅
Reward Modeling	✅	✅	✅	✅
PPO Training	✅	✅	✅	✅
DPO Training	✅	✅	✅	✅
KTO Training	✅	✅	✅	✅
ORPO Training	✅	✅	✅	✅
SimPO Training	✅	✅	✅	✅

由 Opengist 强力驱动 ⋅ Load: 34ms⋅

中文