| groupId | int | 数据集ID |
| datasetid | int | 数据集版本ID |
| importRecordCount | int | 导入次数 |
| exportRecordCount | int | 导出次数 |
| versionId | int | 版本号 |
| displayName | string | 展示名称 |
| bmlDatasetId | string | 字符型数据集唯一id,随机字符串,与存储位置相关 |
| userId | int | 用户id |
| dataType | int | 数据类型 |
| projectType | int | 标注类型 |
| templateType | int | 标注模版 |
| errCode | list | 导入错误码,一次导入可能有多个错误,说明: · 1:上传的文件大小超过限制 · 2:上传的数据集缺少JSON文件 · 3:上传的文件存在格式错误 · 4:您的账户数据集额度已超限 · 5:上传的样本中存在不合法标签 · 6:上传的样本中存在不合法字符 · 7:上传的样本中存在标签数与文本token数不匹配 · 8:上传的样本标签未在label_map中找到 · 9:文本内容格式与要求不匹配,请重新上传 · 10:上传的压缩包解压失败 · 11:上传的数据集缺少xml文件 · 12:上传的已标注文本缺少标注内容 · 13:上传的文本内容为空或存在空行 · 14:上传的文本编码格式仅支持UTF-8,请重新上传 · 15:上传内容中没有可标注的源文件,请重新上传 · 16 :上传的文件内容不符合要求 · 17:当前数据集标签额度已超限 · 18:上传的视频或音频时长超过限制 · 19:分享的压缩包链接无效 · 20:视频转码失败 · 21:文本区间坐标不合法 · 22:order不合法 · 23:传入文件大小为0 · 24:上传的数据集缺少ocr txt标注 · 25:上传的数据集缺少标注文件 · 26:当前数据集的实体数量超过上限 · 27:上传的分辨率不符合要求 · 50:导入数据失败,数据文件列数不能超过1000列 · 51:导入数据失败,数据集总行数不能超过1000万行 · 52:导入数据失败,数据文件大小超过限制 · 53:导入数据失败,请确保文件编码格式为UTF-8或GBK · 54:导入数据失败,新导入文件与数据集schema不一致 · 55:文档解析失败 · 100:网络异常或服务异常 · 300:BOS没有找到文件 |
| uniqueType | int | 是否去重 |
| importErrorInfo | list[dict] | 导入错误详情 |
| remark | string | 版本备注 |
| storageType | string | 存储类型,示例:sysBos |
| storage | dict | 存储信息 |
| importStatus | int | 导入状态,说明: · -1:未发起导入 · 0:导入完成 · 1:等待中 · 2:正在导入 · 3:导入失败 · 4:导入中止 |
| importProgress | int | 导入进度,说明:值范围0-100,例如返回90表示进度为90% |
| exportStatus | int | 导出状态,说明: · -1:未发起导出 · 0:导出初始化 · 1:导出进行中 · 2:导出完成 · 3:导出失败 |
| exportProgress | int | 导出进度,说明:值范围0-100,例如返回90表示进度为90% |
| releaseStatus | int | 发布状态:说明: · 0:未发布 · 1:发布中 · 2:发布成功 · 3:发布失败 |
| releaseErrCode | int | 发布错误状态码 |
| releaseStoragePath | string | 发布存储目录 |
| releaseProgress | int | 发布进度,说明:值范围0-100,例如返回90表示进度为90% |
| annotatedEntityCount | int | 已标注实体数量 |
| entityCount | int | 实体数量 |
| labelCount | int | 标签数量 |
| memorySize | int | 数据集大小,单位MB |
| characterCount | int | 字符数 |
| isEnhancing | bool | 是否正在增强 |
| enhanceStatus | int | 增强状态,说明: · -1:无状态,表示没有任务 · 0:创建待运行 · 1:运行中 · 2:已完成 · 3:已停止 · 4:已失败 |
| hasEnhance | bool | 是否增强过 |
| isSelfInstructEnhance | bool | 是否自监督式增强 |
| interAnnoRunning | bool | 是否正在智能标注 |
| hardSampleCount | int | 智能标注的难例 |
| etlStatus | int | 清洗状态,说明: · 0:无状态,表示没有任务 · 1:运行中 · 2:已完成 · 3:任务终止 · 4:任务失败 · 5:任务暂停 |
| hasEtl | bool | 是否清洗过 |
| isPipelineEtl | bool | 是否pipeline清洗 |
| teamAnnoStatus | int | 多人标注状态,说明: · 0:已创建、任务分配中 · 1:待标注 · 2:标注中 · 3:标注完成(所有子任务提交) · 4:已终止(保留标注)、验收中 · 5:已终止 · 6:验收完成 · 8:已创建、分配完成 · 9:智能标注中 · 16:任务处理失败 |
| hasTeamAnno | bool | 是否在多人标注 |
| promptOptimizeStatus | int | 是否在prompt优化,说明: · 1:进行中 · 2:已完成 · 3:失败 |
| demandStatus | string | 众测标注 |
| view | int | 浏览量 |
| usage | int | 使用量 |
| description | string | 描述 |
| tag | list[dict] | 数据集相关标签列表 |
| license | string | 证书 |
| copyright | string | 版权 |
| copyrightLink | string | 版权链接 |
| createTime | string | 创建时间 |
| modifyTime | string | 更新时间 |