文心一言-千帆大模型平台
数据管理
数据集管理
文心一言-千帆大模型平台
体验中心
常见问题
大模型技术测试服务协议
账号与权限管理
账号创建与权限分配
通过子账户隔离实现账单隔离
产品简介
什么是百度智能云千帆大模型平台
百度智能云千帆大模型平台产品优势
百度智能云千帆大模型平台常用概念
新手指南
SFT调优快速手册
SFT最佳实践
平台使用快速开始
导入并部署第三方模型
快速导入并部署第三方模型
SQLCoder自定义模型导入·详细操作
模型广场
查看与管理预置模型
预置调用免费模型列表
我的模型
创建我的模型
查看与管理我的模型
Prompt 工程
什么 Prompt 工程
Prompt 模板
Prompt 优化
Prompt 工程使用技巧
Prompt 的使用技巧
基础的 Basic Prompt Framework
丰富的 CRISPE Prompt Framework
轻量化的 Few-shot Prompt
模型服务
应用接入
在线服务
调用统计
模型调优
模型精调
Post-pretrain
什么是 Post-pretrain
创建 Post-pretrain 任务
查看与管理 Post-pretrain
SFT
创建 SFT 任务
查看与管理 SFT 运行
RLHF
什么是 RLHF 训练
创建奖励模型训练任务
查看与管理奖励模型训练运行
创建强化学习训练任务
查看与管理强化学习训练运行
模型评估
创建模型评估任务
查看与管理模型评估任务
模型压缩
创建模型压缩任务
查看模型压缩任务
数据管理
数据回流
数据集对应关系说明
数据集管理
创建数据集
数据分析
导入文本对话数据
导入泛文本无标注数据
导入 query 问题集数据
导入文生图数据
管理数据集版本
导出数据
数据集的其他操作
数据标注
在线标注
众测标注
数据处理
数据清洗
数据增强
知识库
什么是千帆大模型知识库
知识库管理
命中测试
系统配置
计算资源
计费管理
插件编排
什么是插件应用
插件编排使用说明
应用创建
对话场景类应用
生成场景类应用
插件
插件列表
自定义插件
插件开发者文档
API 鉴权及调用
API 介绍
API 列表
API 调用指南
API 调用流程
错误码
API 在线调试
鉴权认证
鉴权介绍
使用网页调试工具获取 access_token
获取 access_token
POST
对话 Chat
Llama-2
Llama-2-7b-chat
POST
Llama-2-13b-chat
POST
Llama-2-70b-chat
POST
ERNIE-Bot 4.0
POST
ERNIE-Bot
POST
ERNIE-Bot-turbo
POST
BLOOMZ-7B
POST
Qianfan-BLOOMZ-7B-compressed
POST
Mistral-7B-Instruct
POST
Qianfan-Chinese-Llama-2-7B
POST
Qianfan-Chinese-Llama-2-13B
POST
Linly-Chinese-LLaMA-2-7B
POST
Linly-Chinese-LLaMA-2-13B
POST
ChatGLM2-6B
POST
ChatGLM2-6B-32K
POST
ChatGLM2-6B-INT4
POST
Baichuan2-13B-Chat
POST
XVERSE-13B-Chat
POST
Falcon-7B
POST
Falcon-40B-Instruct
POST
AquilaChat-7B
POST
RWKV-4-World
POST
RWKV-4-pile-14B
POST
RWKV-Raven-14B
POST
OpenLLaMA-7B
POST
Dolly-12B
POST
MPT-7B-Instruct
POST
MPT-30B-instruct
POST
OA-Pythia-12B-SFT-4
POST
Falcon-180B-Chat
POST
RWKV-5-World
POST
Flan-UL2
POST
续写 Completions
SQLCoder-7B
POST
CodeLlama-7b-Instruct
POST
AquilaCode-multi
POST
Cerebras-GPT-13B
POST
Pythia-12B
POST
GPT-J-6B
POST
GPT-NeoX-20B
POST
GPT4All-J
POST
StarCoder
POST
StableLM-Alpha -7B
POST
Pythia-6.9B
POST
Cerebras-GPT-6.7B
POST
向量 Embeddings
Embedding-V1
POST
bge-large-zh
POST
bge-large-en
POST
图像 Images
Stable-Diffusion-XL
POST
自定义模型调用 API
自定义模型调用 API
POST
续写模式
POST
模型服务
创建服务
POST
查询服务详情
POST
模型管理
获取模型版本详情
POST
获取模型详情
POST
训练任务发布为模型
POST
模型调优
创 建训练任务
POST
创建任务运行
POST
获取任务运行详情
POST
停止任务运行
POST
数据管理
创建数据集
POST
发起数据集发布任务
POST
发起数据集导入任务
POST
获取数据集详情
POST
获取数据集状态详情
POST
发起数据集导出任务
POST
删除数据集
POST
获取数据集导出记录
POST
获取数据集导入错误详情
POST
Prompt 工程
Prompt 模板
POST
插件应用
知识库
POST
智慧图问
POST
天气
POST
SDK 参考
千帆 SDK 介绍
SDK 安装及使用流程
对话 Chat
续写 Completions
向量 Embeddings
模型服务
创建服务
查询服务详情
模型管理
获取模型详情
获取模型版本详情
训练任务发布为模型
模型调优
创建训练任务
创建任务运行
获取任务运行详情
停止任务运行
数据管理
创建数据集
发起数据集发布任务
发起数据集导入任务
获取数据集详情
获取数据集状态详情
发起数据集导出任务
删除数据集
获取数据集导出记录
获取数据集导入错误详情
插件应用
知识库
智能图问
天气
价格说明
千帆大模型平台价格文档
数据管理
数据集管理
数据分析
数据分析是大模型平台面向大模型文本数据的分析,包括数据的领域类型/任务类型的分布统计和初步质量检查。帮助您更好地理解数据,为模型训练提供更准确的基础数据。
数据分析是构建高性能、高质量和全面适用性的大型语言模型的关键步骤之一。它有助于确保模型在广泛应用中表现出色,并且符合道德和法律规定,同时减少潜在的问题和挑战。
登录到
千帆大模型操作台
,进入
数据分析
主任务界面。
创建任务
#
1.在主任务界面,需要您选择
创建任务
:
数据集选择:当前千帆大模型平台支持对文本数据进行数据分析,您选择的数据集需为平台发布的
非空文本
数据集。
分析方法:分布统计文本数据的涉及的领域类型和任务类型等;质量检查则对字重复率、困惑度、特殊字符率等进行统计检查。
2.以上内容完成后,点击“确定”,即可进入数据分析阶段。
操作任务
#
当数据分析任务的状态变为“已完成”时,您可以对任务的分析结果进行详情查看和删除操作。
注意
:针对未发布的数据集,新增导入的数据不纳入本次数据分析任务,数据集以创建任务时的状态为准,删除数据也不影响已经生成的分布统计结果。
详情
#
选择任务操作列的“详情”按钮,即可查看选择分析方式的输出结果。
分布统计:查看自动分析的领域类型和任务类型,并且您可以对筛选出的数据集进行查看和删除。需注意:数据集发布后,不可在此界面删除。一旦删除数据,将不可恢复。
质量检查:输出数据分析任务的词目数、字重复率、特殊字符率等内容,如下所示:
注意
:未发布的数据新增数据不再纳入质量检查分析范围,但是删除数据后,质量检查将无法查看数据内容。
删除
#
您可以在 完成数据分析任务后,在操作列“删除”此操作,任务一旦删除,将不可恢复。
相关文档
#
数据清洗
、
数据增强
修改于
2023-11-15 03:03:59
上一页
创建数据集
下一页
导入文本对话数据