knox / LLaMA-Factory-2.md

Me gusta 0

Bifurcar 0

Última actividad 1728786012

Descargar ZIP

Revisión 5aaa9c49f4b3130408b5d86e4e5def4c91fb3588

LLaMA-Factory-2.md · 1.1 KiB · Markdown Sin formato

Approach
Full-tuning
Freeze-tuning
LoRA
QLoRA


Pre-Training
✅
✅
✅
✅

Supervised Fine-Tuning
✅
✅
✅
✅

Reward Modeling
✅
✅
✅
✅

PPO Training
✅
✅
✅
✅

DPO Training
✅
✅
✅
✅

KTO Training
✅
✅
✅
✅

ORPO Training
✅
✅
✅
✅

SimPO Training
✅
✅
✅
✅

Approach	Full-tuning	Freeze-tuning	LoRA	QLoRA
Pre-Training	✅	✅	✅	✅
Supervised Fine-Tuning	✅	✅	✅	✅
Reward Modeling	✅	✅	✅	✅
PPO Training	✅	✅	✅	✅
DPO Training	✅	✅	✅	✅
KTO Training	✅	✅	✅	✅
ORPO Training	✅	✅	✅	✅
SimPO Training	✅	✅	✅	✅

Desarrollado por Opengist ⋅ Load: 36ms⋅

Español