获取数据集导入错误详情
POST
https://qianfan.baidubce.com/wenxinworkshop/dataset/importErrorDetail功能介绍
获取数据集导入时错误的详情。
注意事项
- 鉴权机制,调用本文API,使用“安全认证/Access Key ”中的Access Key ID 和 Secret Access Key等鉴权,无法使用获取Access Token的方式鉴权,具体鉴权认证机制参考“百度云鉴权认证机制”。
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
名称 | 描述 |
---|---|
error_code | 错误码 |
error_msg | 错误描述信息,帮助理解和解决发生的错误 |
例如参数错误返回:
{
"error_code": 500001,
"error_msg": "param invalid"
}
数据管理相关错误码,请查看错误码说明。
请求参数
数据集版本ID,示例:8174,可以通过以下任一方式获取该字段值: · 方式一,通过调用创建数据集接口,返回的id字段获取 · 方式二,在千帆控制台-数据集管理列表页面查看,如下图所示:
错误码,调用获取数据集状态详情接口时,如果有错误会返回导入错误信息importErrorInfo字段;一般有以下值: · 1:上传的文件大小超过限制 · 2:上传的数据集缺少JSON文件 · 3:上传的文件存在格式错误 · 4:您的账户数据集额度已超限 · 5:上传的样本中存在不合法标签 · 6:上传的样本中存在不合法字符 · 7:上传的样本中存在标签数与文本token数不匹配 · 8:上传的样本标签未在label_map中找到 · 9:文本内容格式与要求不匹配,请重新上传 · 10:上传的压缩包解压失败 · 11:上传的数据集缺少xml文件 · 12:上传的已标注文本缺少标注内容 · 13:上传的文本内容为空或存在空行 · 14:上传的文本编码格式仅支持UTF-8,请重新上传 · 15:上传内容中没有可标注的源文件,请重新上传 · 16 :上传的文件内容不符合要求 · 17:当前数据集标签额度已超限 · 18:上传的视频或音频时长超过限制 · 19:分享的压缩包链接无效 · 20:视频转码失败 · 21:文本区间坐标不合法 · 22:order不合法 · 23:传入文件大小为0 · 24:上传的数据集缺少ocr txt标注 · 25:上传的数据集缺少标注文件 · 26:当前数据集的实体数量超过上限 · 27:上传的分辨率不符合要求 · 50:导入数据失败,数据文件列数不能超过1000列 · 51:导入数据失败,数据集总行数不能超过1000万行 · 52:导入数据失败,数据文件大小超过限制 · 53:导入数据失败,请确保文件编码格式为UTF-8或GBK · 54:导入数据失败,新导入文件与数据集schema不一致 · 55:文档解析失败 · 100:网络异常或服务异常 · 300:BOS没有找到文件
{
"datasetId": 2307,
"errCode": 55
}
示例代码
返回响应
导入类型,说明: · file:从文件导入 · copy:从其他数据集复制
是否为压缩文件,说明: · 0:否 · 1:是
标注类型说明: · 20:文本对话 · 401:泛文本无标注 · 402:query问题集 · 705:文生图
{
"log_id": "ve8kch3yydh7x9b4",
"result": {
"dataType": "file",
"downloadUrl": "https://bj.bcebos.com/sdc-default/_system_/dataset/ds-tgs00yra246ssn7t/texts/err_file/5287/%E6%95%B0%E6%8D%AE%E9%9B%862307_%E4%BB%BB%E5%8A%A15287%E5%AF%BC%E5%85%A5%E5%A4%B1%E8%B4%A5%E5%8E%9F%E5%9B%A0.xlsx?authorization=bce-auth-v1%2F50c8bb753dcb4e1d8646bb1ffefd3503%2F2023-11-07T02%3A46%3A21Z%2F3600%2Fhost%2Fb2f7126a5d30c712bc8dd07c48ca6dd3d4f57a6b0148d40d0bd175d20e1bb316",
"isZip": 0,
"projectType": 401,
"content": [
{
"sequence": 1,
"sampleFileName": "",
"sampleName": "WENXINWORKSHOP (1).docx",
"textLocation": 0,
"textContent": ""
}
]
},
"status": 200,
"success": true
}