文心一言-千帆大模型平台
  1. API 鉴权及调用
文心一言-千帆大模型平台
  • 体验中心
  • 常见问题
  • 大模型技术测试服务协议
  • 账号与权限管理
    • 账号创建与权限分配
    • 通过子账户隔离实现账单隔离
  • 产品简介
    • 什么是百度智能云千帆大模型平台
    • 百度智能云千帆大模型平台产品优势
    • 百度智能云千帆大模型平台常用概念
  • 新手指南
    • SFT调优快速手册
    • SFT最佳实践
    • 平台使用快速开始
    • 导入并部署第三方模型
      • 快速导入并部署第三方模型
      • SQLCoder自定义模型导入·详细操作
  • 模型广场
    • 查看与管理预置模型
    • 预置调用免费模型列表
  • 我的模型
    • 创建我的模型
    • 查看与管理我的模型
  • Prompt 工程
    • 什么 Prompt 工程
    • Prompt 模板
    • Prompt 优化
    • Prompt 工程使用技巧
      • Prompt 的使用技巧
      • 基础的 Basic Prompt Framework
      • 丰富的 CRISPE Prompt Framework
      • 轻量化的 Few-shot Prompt
  • 模型服务
    • 应用接入
    • 在线服务
    • 调用统计
  • 模型调优
    • 模型精调
      • Post-pretrain
        • 什么是 Post-pretrain
        • 创建 Post-pretrain 任务
        • 查看与管理 Post-pretrain
      • SFT
        • 创建 SFT 任务
        • 查看与管理 SFT 运行
      • RLHF
        • 什么是 RLHF 训练
        • 创建奖励模型训练任务
        • 查看与管理奖励模型训练运行
        • 创建强化学习训练任务
        • 查看与管理强化学习训练运行
    • 模型评估
      • 创建模型评估任务
      • 查看与管理模型评估任务
    • 模型压缩
      • 创建模型压缩任务
      • 查看模型压缩任务
  • 数据管理
    • 数据回流
    • 数据集对应关系说明
    • 数据集管理
      • 创建数据集
      • 数据分析
      • 导入文本对话数据
      • 导入泛文本无标注数据
      • 导入 query 问题集数据
      • 导入文生图数据
      • 管理数据集版本
      • 导出数据
      • 数据集的其他操作
    • 数据标注
      • 在线标注
      • 众测标注
    • 数据处理
      • 数据清洗
      • 数据增强
    • 知识库
      • 什么是千帆大模型知识库
      • 知识库管理
      • 命中测试
  • 系统配置
    • 计算资源
    • 计费管理
    • 插件编排
      • 什么是插件应用
      • 插件编排使用说明
      • 应用创建
        • 对话场景类应用
        • 生成场景类应用
      • 插件
        • 插件列表
        • 自定义插件
        • 插件开发者文档
  • API 鉴权及调用
    • API 介绍
    • API 列表
    • API 调用指南
      • API 调用流程
      • 错误码
      • API 在线调试
    • 鉴权认证
      • 鉴权介绍
      • 使用网页调试工具获取 access_token
      • 获取 access_token
    • 对话 Chat
      • Llama-2
        • Llama-2-7b-chat
        • Llama-2-13b-chat
        • Llama-2-70b-chat
      • ERNIE-Bot 4.0
      • ERNIE-Bot
      • ERNIE-Bot-turbo
      • BLOOMZ-7B
      • Qianfan-BLOOMZ-7B-compressed
      • Mistral-7B-Instruct
      • Qianfan-Chinese-Llama-2-7B
      • Qianfan-Chinese-Llama-2-13B
      • Linly-Chinese-LLaMA-2-7B
      • Linly-Chinese-LLaMA-2-13B
      • ChatGLM2-6B
      • ChatGLM2-6B-32K
      • ChatGLM2-6B-INT4
      • Baichuan2-13B-Chat
      • XVERSE-13B-Chat
      • Falcon-7B
      • Falcon-40B-Instruct
      • AquilaChat-7B
      • RWKV-4-World
      • RWKV-4-pile-14B
      • RWKV-Raven-14B
      • OpenLLaMA-7B
      • Dolly-12B
      • MPT-7B-Instruct
      • MPT-30B-instruct
      • OA-Pythia-12B-SFT-4
      • Falcon-180B-Chat
      • RWKV-5-World
      • Flan-UL2
    • 续写 Completions
      • SQLCoder-7B
      • CodeLlama-7b-Instruct
      • AquilaCode-multi
      • Cerebras-GPT-13B
      • Pythia-12B
      • GPT-J-6B
      • GPT-NeoX-20B
      • GPT4All-J
      • StarCoder
      • StableLM-Alpha -7B
      • Pythia-6.9B
      • Cerebras-GPT-6.7B
    • 向量 Embeddings
      • Embedding-V1
      • bge-large-zh
      • bge-large-en
    • 图像 Images
      • Stable-Diffusion-XL
    • 自定义模型调用 API
      • 自定义模型调用 API
      • 续写模式
    • 模型服务
      • 创建服务
      • 查询服务详情
    • 模型管理
      • 获取模型版本详情
      • 获取模型详情
      • 训练任务发布为模型
    • 模型调优
      • 创建训练任务
      • 创建任务运行
      • 获取任务运行详情
      • 停止任务运行
    • 数据管理
      • 创建数据集
      • 发起数据集发布任务
      • 发起数据集导入任务
      • 获取数据集详情
      • 获取数据集状态详情
      • 发起数据集导出任务
      • 删除数据集
      • 获取数据集导出记录
      • 获取数据集导入错误详情
    • Prompt 工程
      • Prompt 模板
    • 插件应用
      • 知识库
      • 智慧图问
      • 天气
  • SDK 参考
    • 千帆 SDK 介绍
    • SDK 安装及使用流程
    • 对话 Chat
    • 续写 Completions
    • 向量 Embeddings
    • 模型服务
      • 创建服务
      • 查询服务详情
    • 模型管理
      • 获取模型详情
      • 获取模型版本详情
      • 训练任务发布为模型
    • 模型调优
      • 创建训练任务
      • 创建任务运行
      • 获取任务运行详情
      • 停止任务运行
    • 数据管理
      • 创建数据集
      • 发起数据集发布任务
      • 发起数据集导入任务
      • 获取数据集详情
      • 获取数据集状态详情
      • 发起数据集导出任务
      • 删除数据集
      • 获取数据集导出记录
      • 获取数据集导入错误详情
    • 插件应用
      • 知识库
      • 智能图问
      • 天气
  • 价格说明
    • 千帆大模型平台价格文档
  1. API 鉴权及调用

API 列表

千帆大模型平台提供了丰富的API能力,包括以下:
模型相关
对话Chat:支持创建chat,用于发起一次对话。
续写Completions:支持创建completion,用于发起一次续写请求,不支持多轮会话等。
向量Embeddings:支持Embeddings,用于根据输入内容生成对应的向量表示。
自定义模型:平台支持HuggingFace Transformer架构的自定义模型导入,将自定义模型发布为服务,并支持通过相关API调用该服务。
图像Images:提供图像相关API能力。
模型服务:提供创建服务、获取服务详情等API能力。
模型管理:提供获取模型、模型版本详情及将训练任务发布为模型等API能力。
模型调优:提供创建训练任务、任务运行、停止任务运行及获取任务运行详情等API能力。
数据管理:提供创建数据集、导入导出数据集等API能力。
Prompt工程:提供模版相关API能力。
插件应用:提供知识库、天气等相关能力。

大模型相关#

对话Chat#

模型介绍支持的API
ERNIE-Bot 4.0ERNIE-Bot 4.0是百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力。创建chat,用于发起一次对话请求。
ERNIE-BotERNIE-Bot是百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力。创建chat,用于发起一次对话请求。
ERNIE-Bot-turboERNIE-Bot-turbo是百度自行研发的大语言模型,覆盖海量中文数据,具有更强的对话问答、内容创作生成等能力,响应速度更快。创建chat,用于发起一次对话请求。
BLOOMZ-7BBLOOMZ-7B是业内知名的大语言模型,由BigScience研发并开源,能够以46种语言和13种编程语言输出文本。创建chat,用于发起一次对话请求。
Qianfan-BLOOMZ-7B-compressed千帆团队在BLOOMZ-7B基础上的压缩版本,融合量化、稀疏化等技术,显存占用降低30%以上。创建chat,用于发起一次对话请求。
Mistral-7B-Instruct由Mistral AI研发并开源的7B参数大语言模型,具备强大的推理性能和效果,对硬件需求更少、在各项评测基准中超越同规模模型。该版本为Mistral-7B-v0.1基础上的微调版本。创建chat,用于发起一次对话请求。
Llama-2-7b-chatLlama-2-7b-chat由Meta AI研发并开源,在编码、推理及知识应用等场景表现优秀,Llama-2-7b-chat是高性能原生开源版本,适用于对话场景。创建chat,用于发起一次对话请求。
Llama-2-13b-chatLlama-2-13b-chat由Meta AI研发并开源,在编码、推理及知识应用等场景表现优秀,Llama-2-13b-chat是性能与效果均衡的原生开源版本,适用于对话场景。创建chat,用于发起一次对话请求。
Llama-2-70b-chatLlama-2-70b-chat由Meta AI研发并开源,在编码、推理及知识应用等场景表现优秀,Llama-2-70b-chat是高精度效果的原生开源版本。创建chat,用于发起一次对话请求。
Qianfan-Chinese-Llama-2-7B千帆团队在Llama-2-7b基础上的中文增强版本,在CMMLU、C-EVAL等中文数据集上表现优异。创建chat,用于发起一次对话请求。
Qianfan-Chinese-Llama-2-13B千帆团队在Llama-2-13b基础上的中文增强版本,在CMMLU、C-EVAL等中文数据集上表现优异。创建chat,用于发起一次对话请求。
Linly-Chinese-LLaMA-2-7B由深圳大学CV研究所Linly项目进行中文增强训练的Llama-2 7b参数版本。创建chat,用于发起一次对话请求。
Linly-Chinese-LLaMA-2-13B由深圳大学CV研究所Linly项目进行中文增强训练的Llama-2 13b参数版本。创建chat,用于发起一次对话请求。
ChatGLM2-6B智谱AI与清华KEG实验室发布的中英双语对话模型,具备强大的推理性能、效果、较低的部署门槛及更长的上下文,在MMLU、CEval等数据集上相比初代有大幅的性能提升。创建chat,用于发起一次对话请求。
ChatGLM2-6B-32K在ChatGLM2-6B的基础上进一步强化了对于长文本的理解能力,能够更好的处理最多32K长度的上下文。创建chat,用于发起一次对话请求。
ChatGLM2-6B-INT4在ChatGLM2-6B的基础上进行INT4 量化,6G 显存支持的对话长度由 1K 提升到了 8K。创建chat,用于发起一次对话请求。
Baichuan2-13B-ChatBaichuan 2 是百川智能推出的新一代开源大语言模型,采用2.6万亿Tokens的高质量语料训练,在权威的中文和英文 benchmark 上均取得同尺寸领先的效果。该版本为130亿参数规模的Chat版本。创建chat,用于发起一次对话请求。
XVERSE-13B-ChatXVERSE-13B-Chat是由深圳元象科技自主研发的支持多语言的大语言模型,支持8k上下文、40多种语言,具备训练效率高、稳定性强、算力利用率高等特点。该版本为130亿参数规模的Chat版本。创建chat,用于发起一次对话请求。
Falcon-7B由TII研发、在精选语料库增强的1500B tokens上进行训练。由OpenBuddy调优并开源,提升了处理复杂对话任务的能力与表现。创建chat,用于发起一次对话请求。
Falcon-40B-Instruct由TII研发的仅使用解码器的模型,并在Baize的混合数据集上进行微调,具备优异的推理效果。创建chat,用于发起一次对话请求。
AquilaChat-7B由智源研究院研发,基于Aquila-7B训练的对话模型,支持流畅的文本对话及多种语言类生成任务,通过定义可扩展的特殊指令规范,实现 AquilaChat对其它模型和工具的调用,且易于扩展。创建chat,用于发起一次对话请求。
RWKV-4-World由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。RWKV-4-World在100多种语言上进行训练,具备优秀的英语零样本与上下文学习能力。创建chat,用于发起一次对话请求。
RWKV-4-pile-14B由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。RWKV-4-pile-14B为在 Pile 数据集上训练的 L40-D5120 因果语言模型。创建chat,用于发起一次对话请求。
RWKV-Raven-14B由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。RWKV-Raven-14B为在Pile数据集上训练,并在Alpaca、CodeAlpaca等上进行微调的Chat版本。创建chat,用于发起一次对话请求。
OpenLLaMA-7B在Meta AI研发的Llama模型基础上,OpenBuddy进行调优,涵盖了更广泛的词汇、通用字符与token嵌入,具备与Llama相当的性能与推理效果。创建chat,用于发起一次对话请求。
Dolly-12B由Databricks训练的指令遵循大语言模型。基于pythia-12b,由InstructGPT论文的能力域中生成的约15k指令/响应微调记录训练。创建chat,用于发起一次对话请求。
MPT-7B-InstructMPT-7B-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在Databricks Dolly-15k、HH-RLHF数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。创建chat,用于发起一次对话请求。
MPT-30B-instructMPT-30M-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在更为丰富的数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。创建chat,用于发起一次对话请求。
OA-Pythia-12B-SFT-4基于Pythia12B,Open-Assistant项目的第4次SFT迭代模型。该模型在https://open-assistant.io/收集的人类反馈的对话数据上进行微调。创建chat,用于发起一次对话请求。
Falcon-180B-Chat由TII研发的仅使用解码器的180B模型,在Ultrachat, Platypus和Airoboros的混合数据集上进行微调,具备优异的推理效果。创建chat,用于发起一次对话请求。
RWKV-5-World由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。创建chat,用于发起一次对话请求。
Flan-UL2由Google研发并开源,基于T5架构的tranformer模型,使用UL2模型相同的配置,在“Flan”数据集上进行微调,在少样本上下文学习中具有优秀的表现。创建chat,用于发起一次对话请求。

续写Completions#

大模型介绍支持的API
SQLCoder-7B由Defog研发、基于Mistral-7B微调的语言模型,用于将自然语言问题转换为SQL语句,具备优秀的生成效果。创建completion,用于发起一次文本续写请求。
CodeLlama-7b-InstructCode Llama是由Meta AI研发并开源的一系列文本生成模型,旨在用于一般代码合成和理解。该模型参数规模为70亿。创建completion,用于发起一次文本续写请求。
AquilaCode-multi由智源研究院研发,基于Aquila-7B训练的代码生成模型,使用经过高质量过滤且有合规开源许可的代码数据进行训练,数据量约为其他开源代码生成模型的10~40%。创建completion,用于发起一次文本续写请求。
Cerebras-GPT-13B由Cerebras研发并开源,使用 Chinchilla 公式进行训练的13B参数GPT模型,可为给定的计算预算提供最高的准确性,具备更低的训练成本与功耗。创建completion,用于发起一次文本续写请求。
Pythia-12B由EleutherAI研发并开源,在Pile数据集上训练的12B参数transformer语言模型。创建completion,用于发起一次文本续写请求。
GPT-J-6BEleutherAI开发的6B参数transformer模型,基于Mesh Transformer JAX训练。创建completion,用于发起一次文本续写请求。
GPT-NeoX-20B由EleutherAI开发,使用GPT-NeoX库,基于Pile训练的200亿参数自回归语言模型,模型结构与GPT-3、GPT-J-6B类似。创建completion,用于发起一次文本续写请求。
GPT4All-J由Nomic AI研发、基于GPT-J在包括文字问题、多轮对话、代码、诗歌、歌曲和故事在内的大量语料上进行精调训练生成的模型。创建completion,用于发起一次文本续写请求。
StarCoder由BigCode研发的15.5B参数模型,基于The Stack (v1.2)的80+编程语言训练,训练语料来自Github。创建completion,用于发起一次文本续写请求。
StableLM-Alpha -7BStability AI开发的7B参数的NeoX transformer架构语言模型,支持4k上下文。创建completion,用于发起一次文本续写请求。
Cerebras-GPT-6.7B由Cerebras研发并开源,使用 Chinchilla 公式进行训练的6.7B参数GPT模型,可为给定的计算预算提供最高的准确性,具备更低的训练成本与功耗。创建completion,用于发起一次文本续写请求。
Pythia-6.9B由EleutherAI研发并开源,在Pile数据集上训练的6.9B参数transformer语言模型。创建completion,用于发起一次文本续写请求。

向量Embeddings#

大模型介绍支持的API
Embedding-V1Embedding-V1是基于百度文心大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、信息推荐、知识挖掘等场景。Embeddings,用于根据输入内容生成对应的向量表示。
bge-large-zh由智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。Embeddings,用于根据输入内容生成对应的向量表示。
bge-large-eh由智源研究院研发的英文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。Embeddings,用于根据输入内容生成对应的向量表示。

自定义模型#

大模型介绍支持的API
自定义模型调用API千帆支持HuggingFace Transformer架构的自定义模型导入,将自定义模型发布为服务,可以通过相关API调用该服务,输入输出模式不同调用的API不同。自定义模型调用API

图像Images#

大模型介绍支持的API
Stable-Diffusion-XL业内知名的跨模态大模型,由StabilityAI研发并开源,有着业内领先的图像生成能力。文生图,用于根据用户输入的文本生成图片。

模型服务#

大模型服务提供了全面的在线服务管理功能,满足不同大语言模型业务场景的需要。大模型服务提供了以下API能力。
API名称介绍
创建服务用于创建服务。
查询服务详情用于查询服务详情。

模型管理#

大模型管理用于集中管理平台训练、压缩及预置的生成式大模型,支持对模型进行评估、压缩及部署大模型管理提供了以下API能力。
API名称介绍
获取模型详情用于根据模型ID获取模型详情,如模型名称、类型、来源、版本列表等。
获取模型版本详情用于根据模型版本ID获取模型版本详情,如模型名称、版本号、模型版本来源类型等。
训练任务发布为模型用于将训练任务的产出发布为模型管理中具体某个模型的版本,支持发布为新建模型的新版本或已有模型新版本。

模型调优#

大模型训练指基于基础模型的Fine-Tuning的训练模式,开发者可以选择适合自己任务场景的训练模式并加以调参训练,从而实现理想的模型效果;也可以通过RLHF训练模式,依次训练奖励模型和利用强化学习机制,训练得到性能更优的模型。大模型训练支持以下API能力。
API名称介绍
创建训练任务用于创建训练任务。
创建任务运行用于创建训练任务运行。
任务运行详情用于获取训练运行详情信息,如任务名称、任务版本、训练方法、训练状态、任务运行时间等。
停止任务运行用于停止训练任务运行。

数据管理#

API名称说明
创建数据集用于创建数据集。
发起数据集发布任务用于发起数据集发布任务。
发起数据集导入任务用于发起数据集导入任务。
获取数据集详情用于查看某数据集详情,如数据集名称、数据类型、版本信息等。
获取数据集状态详情用于批量查询数据集状态。
发起数据集导出任务用于发起数据集导出任务。
删除数据集用于删除数据集。
获取数据集导出记录用于获取某个数据集发起的导出记录。
获取数据集导入错误详情用于获取数据集导入错误的详情。

Prompt工程#

Prompt工程指针对于Prompt进行结构、内容等维度进行优化的AI技术,它把大模型的输入限定在了一个特定的范围之中,进而更好地控制模型的输出。Prompt工程支持以下API能力。
API名称介绍
获取Prompt模板用于获取Prompt工程里面模板的内容。

插件应用#

插件应用是大语言模型(LLM)的应用构建工具,帮助用户快速构建LLM应用或将LLM应用到自建程序中。插件应用支持以下API能力。
API名称介绍
知识库使用知识库中存储的相关内容进行问答增强。
智慧图问使用智慧图文插件可以输出简要图片内容描述等。
天气借助实时天气信息,回答天气相关问题,预报未来天气状况。
上一页
API 介绍
下一页
API 调用流程
Built with