SFT调优快速手册
SFT(有监督微调)概述
什么是SFT
SFT在大语言模型中的应用有以下重要原因:
准备数据
1.LLM大语言模型所需SFT数据
可以从公开网络下载指令数据模板, 并尝试替换内容: https://huggingface.co/datasets/BAAI/COIG
2.Prompt优化
3.数据规模、数据多样性
在扩充数据规模时需要注意数据多样性,多样性的数据可以提高模型性能。
多样性除了从原始数据中获取,也可以通过prompt_template方式构建,对prompt指令进行数据增强,比如中文翻译英文的指令可以拓展为,中译英,翻译中文为英文等相同语义的指令。
在不扩大提示多样性的情况下扩大数据量时,收益会大大减少,而在优化数据质量时,收益会显著增加。
4.数据质量
数据质量可以通过ppl、reward model,文本质量分类模型等方式进行初步评估。经过人工进行后续筛选。
选择SFT的超参数
修改于 2023-11-15 02:09:41