knox / LLaMA-Factory-2.md

To se mi líbí 0

Fork 0

Naposledy aktivní 1728786012

Stáhnout ZIP

Revize 5aaa9c49f4b3130408b5d86e4e5def4c91fb3588

LLaMA-Factory-2.md · 1.1 KiB · Markdown Raw

Approach
Full-tuning
Freeze-tuning
LoRA
QLoRA


Pre-Training
✅
✅
✅
✅

Supervised Fine-Tuning
✅
✅
✅
✅

Reward Modeling
✅
✅
✅
✅

PPO Training
✅
✅
✅
✅

DPO Training
✅
✅
✅
✅

KTO Training
✅
✅
✅
✅

ORPO Training
✅
✅
✅
✅

SimPO Training
✅
✅
✅
✅

Approach	Full-tuning	Freeze-tuning	LoRA	QLoRA
Pre-Training	✅	✅	✅	✅
Supervised Fine-Tuning	✅	✅	✅	✅
Reward Modeling	✅	✅	✅	✅
PPO Training	✅	✅	✅	✅
DPO Training	✅	✅	✅	✅
KTO Training	✅	✅	✅	✅
ORPO Training	✅	✅	✅	✅
SimPO Training	✅	✅	✅	✅

Vytvořeno pomocí Opengist ⋅ Load: 29ms⋅

Čeština