Skip to content

百度千帆 图像生成 API 文档

各模型支持的参数

Qwen-Image 模型

Input 参数

参数名类型必填说明取值范围/格式
promptstring所需生成图片的描述长度不超过 800 字符,可支持中文、英文
negative_promptstring反向提示词,描述不希望画面中生成的内容最大为 500 字符,可支持中文、英文

ExtraBody 参数

参数名类型必填说明默认值取值范围/格式
sizestring支持自定义输出图片分辨率1024x1024最小尺寸为 512x512,最大尺寸为 2048x2048。
建议输出分辨率:
适用头像:["768x768", "1024x1024", "1536x1536", "2048x2048"];
适用文章配图:["1024x768", "2048x1536"];
适用海报传单:["768x1024", "1536x2048"];
适用电脑壁纸:["1024x576", "2048x1152"];
适用海报传单:["576x1024", "1152x2048"]。
格式:宽x高(如 1024x1024)或 宽*高,会自动转换为 宽x高 格式
image_sizestring图片尺寸的别名(映射到 size-格式:宽x高(如 1024x1024)或 宽*高,会自动转换为 宽x高 格式
ninteger生成图片数量1只支持入参 1,设置其他值将导致报错
batch_sizeinteger生成图像数量的别名(映射到 n-只支持入参 1,设置其他值将导致报错
stepsinteger采样步数,数值越大,效果更精细,运行时间更长-取值范围为 1-50
seedinteger随机种子-取值范围 [0, 4294967295]。不设置时,自动生成随机数
guidancenumber指导密度值,用于在图像生成过程中调整模型的创造性与文本指导的紧密度。较高的值会使得生成的图像更忠于文本提示,但可能减少多样性;较低的值则允许更多创造性,增加图像变化4.0取值范围 0-20
prompt_extendbool是否开启 prompt 智能改写。开启后会使用大模型对输入 prompt 进行智能改写,仅对正向提示词有效。对于较短的输入 prompt 生成效果提升明显,但会增加 3-4 秒耗时truetrue(默认值,默认开启智能改写)或 false(不开启智能改写)
watermarkboolean控制是否添加水印标识falsetrue(生成的图片右下角会自动添加"AI生成"字样的可见水印)或 false(不添加水印,默认值)
userstring终端用户的唯一标识符-字符串
providerobject调度配置参数-对象类型,包含图像生成特有参数和供应商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

供应商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:供应商调度参数说明

请求示例

json
{
  "model": "Qwen-Image",
  "input": {
    "prompt": "一只坐着的橘黄色的猫,表情愉悦,活泼可爱,逼真准确",
    "negative_prompt": "低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "size": "1024x1024",
    "n": 1,
    "steps": 20,
    "seed": 12345,
    "guidance": 4.0,
    "prompt_extend": true,
    "watermark": false
  }
}

Qwen-Image-Edit 模型

Input 参数

参数名类型必填说明取值范围/格式
promptstring图像编辑的描述长度不超过 800 字符,建议填写以获得更好的编辑效果
imagestring/array需编辑的原图。支持字符串格式(单张图像)或数组格式(多张图像)支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。数组格式示例:["url1", "url2", "url3"]["base64_1", "base64_2", "base64_3"]
image2string需编辑的附加图片支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)
image3string需编辑的附加图片支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)

ExtraBody 参数

参数名类型必填说明默认值取值范围/格式
sizestring支持自定义输出图片分辨率1024x1024格式:宽x高(如 1024x1024)或 宽*高
ninteger生成图片数量1仅支持 1
stepsinteger采样步数-取值范围为 1-50
seedinteger随机种子-取值范围 [0, 4294967295]
guidancenumber指导密度值-浮点数
prompt_extendboolean是否开启 prompt 智能改写truetrue(默认)或 false
watermarkboolean控制是否添加水印标识falsetruefalse
userstring终端用户的唯一标识符-字符串
providerobject调度配置参数-对象类型,包含图像生成特有参数和供应商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

供应商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:供应商调度参数说明

请求示例

json
{
  "model": "Qwen-Image-Edit",
  "input": {
    "prompt": "把猫变成狗",
    "image": "http://example.com/cat.jpg"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "size": "1024x1024",
    "n": 1,
    "steps": 20,
    "prompt_extend": true
  }
}

响应示例

所有模型都返回标准化的响应格式,示例如下:

json
{
  "created": 1736123456,
  "data": [
    {
      "url": "http://qianfan-modelbuilder-img-gen.bj.bcebos.com/qwen-image/xxx.png?authorization=xxx",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."  // 可选字段
    }
  ],
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "text_tokens": 0,
      "image_tokens": 0
    },
    "image_count": 1
  },
  "provider": "百度千帆",
  "model": "Qwen-Image",
  "origin_data": { ... }  // 可选字段
}

说明

  • data[].b64_json 字段:仅在 extra_body.provider.enable_image_base64 设置为 true 时返回。默认值为 false,此时响应中不包含 b64_json 字段
  • origin_data 字段:包含供应商 API 的完整原始响应数据。可通过设置 extra_body.provider.enable_image_origin_data 参数控制是否返回此字段(默认值为 false,不会返回)。如需查看不同模型的原始响应格式,请在请求中设置 extra_body.provider.enable_image_origin_data: true,然后在响应的 origin_data 字段中查看供应商返回的原始数据

响应参数说明

成功响应

所有模型都返回标准化的响应格式,包含以下字段:

参数名类型必填说明取值范围/格式
createdinteger响应生成的时间戳(Unix 时间戳)Unix 时间戳(秒)
dataarray生成的图片数组数组对象,每个元素包含:
data[].urlstring生成的图片 URL,图像格式为 PNG。链接有效期为 24 小时,请及时下载并保存图像URL 字符串
data[].b64_jsonstring图像的 Base64 编码数据。控制参数:仅在请求参数 extra_body.provider.enable_image_base64 设置为 true 时返回此字段。默认值为 false,此时不返回此字段Base64 编码的字符串
usageobject使用情况统计对象类型,包含以下字段:
usage.total_tokensinteger总 token 数(图像生成场景通常为 0)整数
usage.input_tokensinteger输入 token 数整数
usage.output_tokensinteger输出 token 数整数
usage.input_tokens_detailsobject输入 token 详情对象类型,包含:
usage.input_tokens_details.text_tokensinteger文本 token 数整数
usage.input_tokens_details.image_tokensinteger图像 token 数整数
usage.image_countinteger生成的图像数量整数
providerstring实际使用的供应商名称字符串,例如 "百度千帆"
modelstring实际使用的模型名称(标准模型名)字符串
origin_dataobject供应商的原始响应数据。控制参数:仅在请求参数 extra_body.provider.enable_image_origin_data 设置为 true 时返回此字段。默认值为 false,此时不返回此字段对象类型,包含供应商 API 的完整原始响应

错误响应

当 API 调用失败时,会返回供应商的原始错误信息。

错误响应格式

  • 如果响应是 JSON 格式,返回完整的错误 JSON 对象
  • 如果响应是文本格式,返回错误文本
  • 如果无法解析,返回 HTTP {status_code}

错误响应示例

json
{
  "code": "InvalidParameter",
  "message": "参数错误",
  "type": "invalid_request_error"
}

注意事项

  1. 模型参数限制:不同模型支持的参数不同。对于不在白名单中的参数,系统会记录警告日志,但不会过滤,仍会传递给供应商 API 进行最终判断

  2. 参数透传:所有参数(包括 sizeimage_sizenbatch_sizestepsseedguidanceprompt_extendwatermarkuser 等)都会透传给供应商 API,由供应商进行校验和判断

  3. 默认值:如果未提供某些参数,系统会使用模型特定的默认值:

    • prompt_extend: true(Qwen-Image 和 Qwen-Image-Edit 默认开启智能改写)
    • watermark: false(默认不添加水印)
    • size: 1024x1024(所有模型默认分辨率)
    • n: 1(所有模型默认值)
    • guidance: 4.0(Qwen-Image 默认值)
  4. 未知参数处理:未知参数会被记录警告日志,但仍会传递给供应商 API,由供应商判断是否返回错误

  5. 供应商调度参数:关于 extra_body.provider 参数的完整说明和使用示例,请参考供应商调度参数说明