预置调用免费模型列表
以下为调用免费的模型列表,点击模型名称,可查看API详细介绍。
注意:此类预置模型部署上线需部署到私有资源池,仍需按照私有池租赁价格进行付费。
资源租赁**入口**:模型服务独立资源部署,保障服务并发。
私有资源池计费详情可查看价格文档,操作步骤详见在线服务使用说明。
模型名称 | 模型类型 | 模型描述 |
---|---|---|
stable-diffusion-xl-base-1.0 | 文生图大模型 | Stability AI 7月27日发布的版本,推理性能与图片质量较此前版本有显著提升。 |
Mistral-7B-Instruct-v0.1「体验」 | 大语言模型 | 在预训练模型Mistral-7B-v0.1基础上的微调版本。 |
Qianfan-Chinese-Llama-2-7B「体验」 | 大语言模型 | 千帆团队在Llama-2-7b基础上的中文增强版本,在CMMLU、C-EVAL等中文数据集上表现优异。 |
Linly-Chinese-LLaMA-2-7B「体验」 | 大语言模型 | 由深圳大学CV研究所Linly项目进行中文增强训练的7b参数版本。 |
Llama-2-7b-chat「体验」 | 大语言模型 | Llama-2-7b-chat是高性能原生开源版本,适用于对话场景。 |
Linly-Chinese-LLaMA-2-13B「体验」 | 大语言模型 | 由深圳大学CV研究所Linly项目进行中文增强训练的13b参数版本。 |
Llama-2-13b-chat「体验」 | 大语言模型 | Llama-2-13b-chat是性能与效果均衡的原生开源版本,适用于对话场景。 |
Llama-2-70b-chat「体验」 | 大语言模型 | 由Meta AI研发并开源的70B参数大语言模型,在编码、推理及知识应用等场景表现优秀。 |
RWKV-4-World「体验」 | 大语言模型 | 由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。 |
chatglm2-6b-int4「体验」 | 大语言模型 | 在ChatGLM2-6B的基础上进行INT4 量化,6G 显存支持的对话长度由 1K 提升到了 8K。 |
chatglm2-6b-32k「体验」 | 大语言模型 | 在ChatGLM2-6B的基础上进一步强化了对于长文本的理解能力,能够更好的处理最多32K长度的上下文。 |
chatglm2-6b「体验」 | 大语言模型 | 初始预训练版本。 |
Baichuan2-13B-Chat「体验」 | 大语言模型 | 该版本为130亿参数规模的Chat版本。 |
XVERSE-13B-Chat「体验」 | 大语言模型 | 该版本为130亿参数规模的Chat版本。 |
sqlcoder-7b「体验」 | 大语言模型 | 由Defog研发、基于Mistral-7B微调的语言模型,用于将自然语言问题转换为SQL语句,具备优秀的生成效果。 |
openllama-7b-v5-fp16「体验」 | 大语言模型 | 在Meta AI研发的Llama模型基础上,OpenBuddy进行调优,涵盖了更广泛的词汇、通用字符与token嵌入,具备与Llama相当的性能与推理效果。 |
falcon-7b-v5-fp16「体验」 | 大语言模型 | 由TII研发、在精选语料库增强的1500B tokens上进行训练。由OpenBuddy调优并开源,提升了处理复杂对话任务的能力与表现。 |
dolly-v2-12b「体验」 | 大语言模型 | 由Databricks训练的指令遵循大语言模型。基于pythia-12b,由InstructGPT论文的能力域中生成的约15k指令/响应微调记录训练。 |
mpt-7b-instruct「体验」 | 大语言模型 | MPT-7B-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在Databricks Dolly-15k、HH-RLHF数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。 |
rwkv-raven-14b「体验」 | 大语言模型 | RWKV架构的Chat版本,在Pile数据集上训练,并在Alpaca、CodeAlpaca等上进行微调。 |
RWKV-4-pile-14B「体验」 | 大语言模型 | 在 Pile 数据集上训练的 L40-D5120 因果语言模型。 |
AquilaCode-multi「体验」 | 大语言模型 | 基于Aquila-7B训练的代码生成模型,使用经过高质量过滤且有合规开源许可的代码数据进行训练,数据量约为其他开源代码生成模型的10~40%。 |
AquilaChat-7B「体验」 | 大语言模型 | 基于Aquila-7B训练的对话模型,支持流畅的文本对话及多种语言类生成任务,通过定义可扩展的特殊指令规范,实现 AquilaChat对其它模型和工具的调用,且易于扩展。 |
falcon-40b-instruct「体验」 | 大语言模型 | 由TII研发的仅使用解码器的模型,并在Baize的混合数据集上进行微调,具备优异的推理效果。 |
mpt-30b-instruct「体验」 | 大语言模型 | MPT-30M-Instruct是一种短格式指令遵循模型,由MosaicML研发,基于MPT-7B模型在更为丰富的数据集上调优的版本,采用经过修改的仅使用解码器的transformer架构。 |
Cerebras-GPT-13B「体验」 | 大语言模型 | 由Cerebras研发并开源,使用 Chinchilla 公式进行训练的13B参数GPT模型,可为给定的计算预算提供最高的准确性,具备更低的训练成本与功耗。 |
oasst-sft-4-pythia-12b-epoch-3.5「体验」 | 大语言模型 | 基于Pythia12B,Open-Assistant项目的第4次SFT迭代模型。该模型在https://open-assistant.io/ 收集的人类反馈的对话数据上进行微调。 |
pythia-12b「体验」 | 大语言模型 | 由EleutherAI研发并开源,在Pile数据集上训练的12B参数transformer语言模型。 |
gpt4all-j「体验」 | 大语言模型 | 由Nomic AI研发、基于GPT-J在包括文字问题、多轮对话、代码、诗歌、歌曲和故事在内的大量语料上进行精调训练生成的模型。 |
gpt-j-6b「体验」 | 大语言模型 | EleutherAI开发的6B参数transformer模型,基于Mesh Transformer JAX训练。 |
gpt-neox-20b「体验」 | 大语言模型 | 由EleutherAI开发,使用GPT-NeoX库,基于Pile训练的200亿参数自回归语言模型,模型结构与GPT-3、GPT-J-6B类似。 |
CodeLlama-7b-Instruct「体验」 | 大语言模型 | 该版本为130亿参数规模的Chat版本。 |
starcoder「体验」 | 大语言模型 | 由BigCode研发的15.5B参数模型,基于The Stack (v1.2)的80+编程语言训练,训练语料来自Github。 |
stablelm-base-alpha-7B「体验」 | 大语言模型 | Stability AI开发的7B参数的NeoX transformer架构语言模型,支持4k上下文。 |
需注意:您亦可选择直接调用平台预置服务Llama-2-7-BChat、Llama-2-13B-Chat、Llama-2-70B-Chat,将按照价格文档收取调用费。
以下API目前面向测试企业用户开放,如需使用请填写申请表单,我们将尽快评估您的需求并与您取得联系:
模型名称 | 描述 |
---|---|
RWKV-5-World | 由香港大学物理系校友彭博研发并开源,结合了Transformer与RNN的优点,具备优秀的推理性能与效果。 |
Flan-UL2 | 由Google研发并开源,基于T5架构的tranformer模型,使用UL2模型相同的配置,在“Flan”数据集上进行微调。 |
Cerebras-GPT-6.7B | 由Cerebras研发并开源,使用 Chinchilla 公式进行训练的6.7B参数GPT模型,可为给定的计算预算提供最高的准确性,具备更低的训练成本与功耗。 |
Pythia-6.9B | 由EleutherAI研发并开源,在Pile数据集上训练的6.9B参数transformer语言模型。 |
Falcon-180B-Chat | 由TII研发的仅使用解码器的18B模型,在Ultrachat,Platypus和Airoboros的混合数据集上进行微调,具备优异的推理效果。 |
更多优质模型持续接入中,敬请期待!
修改于 10 个月前