

| 字段 | 内容 | 描述 |
|---|---|---|
| 服务名称 | 用户定义的服务名称 | 必填项,不超过20字,支持中英文 |
| 服务描述 | 用户定义的服务描述 | 非必填,最多支持300个字符 |
| 选择模型 | 模型名称 | 必选项,选择对应发布的模型,可以是运行成功的自训练模型或预置模型,并选定模型版本 |
| API地址 | 用户定义的接口地址 | 必填项,仅支持英文,接口地址需要多于5个字符但不能超过20个字符。 同一个账户下的接口地址 不支持重复。 |

| 字段 | 内容 | 描述 |
|---|---|---|
| 资源池 | 公共资源池、私有资源池 | 选择服务可托管的资源池,如服务托管在私有资源池,可设定在线服务部署的算力单元来保障QPS。 |
| 租赁方式 | 时间单位:时/天/月 | ⼩时范围:1-23;天数范围:1-29;包⽉范围:1-12。 |
| 生效时间 | 日期选择 | 选择服务运行的开始和结束时间,不可选择早于今天的日期 |
| 失效时间 | 自动生成 | 当您选择租赁方式和生效时间后,自动计算失效时间 |
| 算力单元 | 设置算力单元数 | 为当前服务部署所占用的算力单元数量。算力单元越多,其可承载的QPS越高,仅支持服务部署所需最小算力单元数的整数倍调整 |
| 预估首Tokens时延 | 平台自动生成 | 用于评估在将数据写入持久性存储设备时,系统处理数据并返回给客户端所需的时间。 |
| 预估QPS | 平台自动生成 | 服务运行中产生的并发,受服务和生效时间限制。 |

