查看与管理 SFT 运行

在SFT任务界面，可以查看任务的详情、新建运行任务和删除整个任务（包括运行）。
在指定任务的详情页面，可以查看所有的模型训练运行任务状态及其他相关内容。

登录到千帆大模型操作台，在左侧功能列选择SFT，进入SFT主任务界面。

详情

在SFT的详情页，即可查看训练运行的列表。此界面可选择“新建运行”。

点击运行名称，在运行任务的详情页可查看创建运行时的基本信息、训练配置和数据配置，详情数据的来源为创建SFT任务时新建运行时填入的内容。

可以指定某个运行成功的任务，发布为模型。
填写好如下参数后，将被模型管理所纳管。

可以查看指定运行中心评估报告，包含评估信息的指标参数和Training Loss的曲线图。

BLEU 指标是NLP中机器翻译/⽂本摘要等任务常⽤的评价指标。它是基于精确率（Precision）来设计的。NLP中有个重要的概念是n-gram，指⼀个语句⾥⾯连续的n个单词组成的⽚段；BLEU-n其实就是基于n-gram的评价指标。
rouge-N（1/2/L）-f：百分⽐。ROUGE通过将模型⽣成的摘要或者回答与参考答案（⼀般是⼈⼯⽣成的）进⾏⽐较计算，得到对应的得分。Rouge-N实际上是将模型⽣成的结果和标准结果按N-gram拆分后，计算召回率。
Perplexity：困惑度，可以用来衡量大语言模型预测一个语言样本的能力，一个模型推理时的Perplexity数值越低，准确率也就越高，代表模型表现越好，反之亦然。
Training Loss：训练集每个batch的损失。
（2）文生图大模型评估信息如下：

CLIP Score：Contrastive Language-Image Pretraining (CLIP)评估自然语言和图像对之间的匹配度和相关性。值越大（接近1）代表效果越好。
FID Score：Frechet Inception Distance（FID）借助Inception作为feature extractor，是生成图像与真实图像之间的相似性（距离）度量。值越小代表效果越好。
Training Loss：训练集每个Iter的损失。

可以查看运行任务的训练情况，分为概览日志和训练日志两部分，日志内容均支持下载（txt格式）。

概览日志部分内容如下所示：

可以查看训练过程中的实时的参数变化。关于各项参数指标的定义可查看可视化指导。

支持删除运行任务，运行任务一旦删除便不可恢复。

最后修改时间： 1 年前