文心一言-千帆大模型平台
  1. 产品简介
文心一言-千帆大模型平台
  • 体验中心
  • 常见问题
  • 大模型技术测试服务协议
  • 账号与权限管理
    • 账号创建与权限分配
    • 通过子账户隔离实现账单隔离
  • 产品简介
    • 什么是百度智能云千帆大模型平台
    • 百度智能云千帆大模型平台产品优势
    • 百度智能云千帆大模型平台常用概念
  • 新手指南
    • SFT调优快速手册
    • SFT最佳实践
    • 平台使用快速开始
    • 导入并部署第三方模型
      • 快速导入并部署第三方模型
      • SQLCoder自定义模型导入·详细操作
  • 模型广场
    • 查看与管理预置模型
    • 预置调用免费模型列表
  • 我的模型
    • 创建我的模型
    • 查看与管理我的模型
  • Prompt 工程
    • 什么 Prompt 工程
    • Prompt 模板
    • Prompt 优化
    • Prompt 工程使用技巧
      • Prompt 的使用技巧
      • 基础的 Basic Prompt Framework
      • 丰富的 CRISPE Prompt Framework
      • 轻量化的 Few-shot Prompt
  • 模型服务
    • 应用接入
    • 在线服务
    • 调用统计
  • 模型调优
    • 模型精调
      • Post-pretrain
        • 什么是 Post-pretrain
        • 创建 Post-pretrain 任务
        • 查看与管理 Post-pretrain
      • SFT
        • 创建 SFT 任务
        • 查看与管理 SFT 运行
      • RLHF
        • 什么是 RLHF 训练
        • 创建奖励模型训练任务
        • 查看与管理奖励模型训练运行
        • 创建强化学习训练任务
        • 查看与管理强化学习训练运行
    • 模型评估
      • 创建模型评估任务
      • 查看与管理模型评估任务
    • 模型压缩
      • 创建模型压缩任务
      • 查看模型压缩任务
  • 数据管理
    • 数据回流
    • 数据集对应关系说明
    • 数据集管理
      • 创建数据集
      • 数据分析
      • 导入文本对话数据
      • 导入泛文本无标注数据
      • 导入 query 问题集数据
      • 导入文生图数据
      • 管理数据集版本
      • 导出数据
      • 数据集的其他操作
    • 数据标注
      • 在线标注
      • 众测标注
    • 数据处理
      • 数据清洗
      • 数据增强
    • 知识库
      • 什么是千帆大模型知识库
      • 知识库管理
      • 命中测试
  • 系统配置
    • 计算资源
    • 计费管理
    • 插件编排
      • 什么是插件应用
      • 插件编排使用说明
      • 应用创建
        • 对话场景类应用
        • 生成场景类应用
      • 插件
        • 插件列表
        • 自定义插件
        • 插件开发者文档
  • API 鉴权及调用
    • API 介绍
    • API 列表
    • API 调用指南
      • API 调用流程
      • 错误码
      • API 在线调试
    • 鉴权认证
      • 鉴权介绍
      • 使用网页调试工具获取 access_token
      • 获取 access_token
    • 对话 Chat
      • Llama-2
        • Llama-2-7b-chat
        • Llama-2-13b-chat
        • Llama-2-70b-chat
      • ERNIE-Bot 4.0
      • ERNIE-Bot
      • ERNIE-Bot-turbo
      • BLOOMZ-7B
      • Qianfan-BLOOMZ-7B-compressed
      • Mistral-7B-Instruct
      • Qianfan-Chinese-Llama-2-7B
      • Qianfan-Chinese-Llama-2-13B
      • Linly-Chinese-LLaMA-2-7B
      • Linly-Chinese-LLaMA-2-13B
      • ChatGLM2-6B
      • ChatGLM2-6B-32K
      • ChatGLM2-6B-INT4
      • Baichuan2-13B-Chat
      • XVERSE-13B-Chat
      • Falcon-7B
      • Falcon-40B-Instruct
      • AquilaChat-7B
      • RWKV-4-World
      • RWKV-4-pile-14B
      • RWKV-Raven-14B
      • OpenLLaMA-7B
      • Dolly-12B
      • MPT-7B-Instruct
      • MPT-30B-instruct
      • OA-Pythia-12B-SFT-4
      • Falcon-180B-Chat
      • RWKV-5-World
      • Flan-UL2
    • 续写 Completions
      • SQLCoder-7B
      • CodeLlama-7b-Instruct
      • AquilaCode-multi
      • Cerebras-GPT-13B
      • Pythia-12B
      • GPT-J-6B
      • GPT-NeoX-20B
      • GPT4All-J
      • StarCoder
      • StableLM-Alpha -7B
      • Pythia-6.9B
      • Cerebras-GPT-6.7B
    • 向量 Embeddings
      • Embedding-V1
      • bge-large-zh
      • bge-large-en
    • 图像 Images
      • Stable-Diffusion-XL
    • 自定义模型调用 API
      • 自定义模型调用 API
      • 续写模式
    • 模型服务
      • 创建服务
      • 查询服务详情
    • 模型管理
      • 获取模型版本详情
      • 获取模型详情
      • 训练任务发布为模型
    • 模型调优
      • 创建训练任务
      • 创建任务运行
      • 获取任务运行详情
      • 停止任务运行
    • 数据管理
      • 创建数据集
      • 发起数据集发布任务
      • 发起数据集导入任务
      • 获取数据集详情
      • 获取数据集状态详情
      • 发起数据集导出任务
      • 删除数据集
      • 获取数据集导出记录
      • 获取数据集导入错误详情
    • Prompt 工程
      • Prompt 模板
    • 插件应用
      • 知识库
      • 智慧图问
      • 天气
  • SDK 参考
    • 千帆 SDK 介绍
    • SDK 安装及使用流程
    • 对话 Chat
    • 续写 Completions
    • 向量 Embeddings
    • 模型服务
      • 创建服务
      • 查询服务详情
    • 模型管理
      • 获取模型详情
      • 获取模型版本详情
      • 训练任务发布为模型
    • 模型调优
      • 创建训练任务
      • 创建任务运行
      • 获取任务运行详情
      • 停止任务运行
    • 数据管理
      • 创建数据集
      • 发起数据集发布任务
      • 发起数据集导入任务
      • 获取数据集详情
      • 获取数据集状态详情
      • 发起数据集导出任务
      • 删除数据集
      • 获取数据集导出记录
      • 获取数据集导入错误详情
    • 插件应用
      • 知识库
      • 智能图问
      • 天气
  • 价格说明
    • 千帆大模型平台价格文档
  1. 产品简介

百度智能云千帆大模型平台常用概念

数据服务相关#

数据是模型训练的基础,在整个模型效果中起着至关重要的作用。平台提供统一的数据集管理接口,将分散的数据进行集中式纳管,节省数据集收集和管理成本。
概念名描述
数据集管理集中管理数据集,对数据进行导入和删除等操作;进行数据集的版本控制,数据纳管标准化运行。
BOS目录导入数据集常用。集中保存数据集的BOS桶,选择Bucket地址和文件夹地址,导入该目录下的数据集,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入,使用BOS需要先开通服务。
分享链接导入数据集常用,第三方数据集链接,仅支持来自百度BOS、阿里OSS、华为OBS的共享链接。
文本对话-非排序此类数据集用于SFT,一个提示词(prompt)对应一个标注(response)。
文本对话-含排序此类数据集用于奖励模型训练,一个提示词(prompt)对应多个标注(response),并且依据人类反馈对标注进行排序。
query问题集此类数据集用于强化学习训练,无需标注,做为问题集组合,会利用prompt对奖励模型进行质问。
众测标注将数据标注任务发布至百度众测平台,百度众测团队具备10年以上的数据服务经验和丰富的标注人力,完成数据标注。
单轮对话只涉及一个核心问题,对话的双方只需要针对这个问题进行回答和交流,不需要对之前的回答进行进一步的追问或解释。
多轮对话对话的双方需要在一系列问题中进行多次交流和回答,每次回答都可能引出下一个问题。

大模型训练相关#

大模型训练是本平台的核心功能,统一查看模型的训练状态选择更加适合的模型训练方式。
概念名描述
训练轮次Epoch,训练轮次可以由步长 x 数据批大小/数据量的形式换算。例如,1w条样本在数据批大小为32的情况下,建议训练轮次至少设置为2。
数据批Batch_size,即一次训练所抓取的数据样本数量,Batch_size大小影响训练速度和模型的优化。
学习率Learning rate (LR),是在梯度下降的过程中更新权重时的超参数,过高会导致模型难以收敛,过低则会导致模型收敛速度过慢,平台已给出默认推荐值,可根据经验调整。
全量更新训练过程中对大模型的全部参数进行更新。
Prompt Tuning在固定预训练大模型本身的参数的基础上,增加prompt embedding参数,并且训练过程中只更新prompt参数。
LoRA在固定预训练大模型本身的参数的基础上,在保留自注意力模块中原始权重矩阵的基础上,对权重矩阵进行低秩分解,训练过程中只更新低秩部分的参数。
奖励模型训练的最终目的是刻画模型的输出是否在人类看来表现不错。
强化学习再励学习、评价学习或增强学习,利用问题集质问奖励模型,合成问题最优解的应答。

大模型管理相关#

集中管理平台训练、压缩及预置的生成式大模型,支持对模型进行评估、压缩及部署。
概念名描述
BOS目录导入第三方模型时常用。集中保存第三方大模型的BOS桶,选择Bucket地址和文件夹地址,导入该目录下的模型,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入,使用BOS需要先开通服务。
HuggingFace > Transformers支持导入的第三方模型格式,详细目录可查看模型格式。
续写模式导入模型时的输入输出格式,适用Pretrain或Post-Pretrain Base模型。
对话模式导入模型时的输入输出格式,对话模式适用经过指令精调的Chat模型。
评估数据集模型进行评估时,通常是在与训练数据集相似的情况下收集的,用来代表真实世界的样本数据,可以是平台数据集或预置数据集。
基于裁判员模型模型评估时,使用能力更强的大模型(ERINE-BOT)作为裁判员,对被评估模型的生成结果进行自动化打分,适用于开放性或复杂问答场景。
量化压缩模型压缩时,同等QPS目标下,降低推理显存占用。
稀疏化模型压缩时,在同等算力资源下,降低单Token时延、提升QPS。

大模型服务相关#

发布公有云服务,将训练完成的模型部署在百度云服务器,通过云服务接口调用模型。
概念名描述
私有资源池服务托管在私有资源池时,可设定在线服务部署的算力单元来保障QPS。
温度temperature,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和top_p只设置1个。
多样性top_p,影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和temperature只设置1个。
重复惩罚penalty_score,用通过对已生成的token增加惩罚,减少重复生成的现象。说明:值越大表示惩罚越大。
AK/SK在创建应用时生成的API Key和Secret Key,调用应用时不轻易泄露的重要凭证。

Prompt工程相关#

平台支持对Prompt模板的使用和管理,并且可以对单独或批量的Prompt进行优化。
概念名描述
prompt提示词,简单的理解成它是给大模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。大模型会基于 prompt 所提供的信息,生成对应的文本或者图片。
思维链条在prompt优化时常用,拆解Prompt内容,逐步进行推理,建议仅在数学计算或逻辑推理场景下开启。
Tip:API相关内容可查看API列表。
上一页
百度智能云千帆大模型平台产品优势
下一页
SFT调优快速手册
Built with