Getting Started

训练方法

[!IMPORTANT] 此步骤为必需。

git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git
cd LlamaFactory
pip install -e .

关于数据集文件的格式，请参考 data-preparation/README.md 的内容。你可以使用 HuggingFace / ModelScope 上的数据集或加载本地数据集。

[!NOTE] 使用自定义数据集或自定义数据集格式时，请参照 data-preparation/README.md 进行配置，如有必要，请重新实现自定义数据集的数据处理逻辑，包括对应的converter。

您也可以使用 Easy Dataset、DataFlow 和 GraphGen 构建用于微调的合成数据。

下面的命令展示了对 Qwen3-0.6B 模型使用 FSDP2 进行全参微调，两行命令等价。

export USE_V1=1
llamafactory-cli sft examples/v1/train_full/train_full_fsdp2.yaml
llamafactory-cli train examples/v1/train_full/train_full_fsdp2.yaml

高级用法请参考 advanced（包括多卡多机微调、分布式、Lora、量化、以及各种加速特性等）。