百度千帆图像生成 API 文档

请求格式

图像生成 API 支持 OpenAI 标准格式（推荐），同时也支持嵌套格式。嵌套格式的详细说明请参见文档末尾。

各模型支持的参数

Qwen-Image 模型

参数说明

参数名	类型	必填	说明	默认值	取值范围/格式
`prompt`	string	是	所需生成图片的描述	-	长度不超过 800 字符，可支持中文、英文
`negative_prompt`	string	否	反向提示词，描述不希望画面中生成的内容	-	最大为 500 字符，可支持中文、英文
`size`	string	否	支持自定义输出图片分辨率	`1024x1024`	最小尺寸为 512x512，最大尺寸为 2048x2048。建议输出分辨率：适用头像：["768x768", "1024x1024", "1536x1536", "2048x2048"]；适用文章配图：["1024x768", "2048x1536"]；适用海报传单：["768x1024", "1536x2048"]；适用电脑壁纸：["1024x576", "2048x1152"]；适用海报传单：["576x1024", "1152x2048"]。格式：`宽x高`（如 `1024x1024`）或 `宽*高`，会自动转换为 `宽x高` 格式
`image_size`	string	否	图片尺寸的别名（映射到 `size`）	-	格式：`宽x高`（如 `1024x1024`）或 `宽*高`，会自动转换为 `宽x高` 格式
`n`	integer	否	生成图片数量	`1`	只支持入参 1，设置其他值将导致报错
`batch_size`	integer	否	生成图像数量的别名（映射到 `n`）	-	只支持入参 1，设置其他值将导致报错
`steps`	integer	否	采样步数，数值越大，效果更精细，运行时间更长	-	取值范围为 1-50
`seed`	integer	否	随机种子	-	取值范围 [0, 4294967295]。不设置时，自动生成随机数
`guidance`	number	否	指导密度值，用于在图像生成过程中调整模型的创造性与文本指导的紧密度。较高的值会使得生成的图像更忠于文本提示，但可能减少多样性；较低的值则允许更多创造性，增加图像变化	`4.0`	取值范围 0-20
`prompt_extend`	bool	否	是否开启 prompt 智能改写。开启后会使用大模型对输入 prompt 进行智能改写，仅对正向提示词有效。对于较短的输入 prompt 生成效果提升明显，但会增加 3-4 秒耗时	`true`	`true`（默认值，默认开启智能改写）或 `false`（不开启智能改写）
`watermark`	boolean	否	控制是否添加水印标识	`false`	`true`（生成的图片右下角会自动添加"AI生成"字样的可见水印）或 `false`（不添加水印，默认值）
`user`	string	否	终端用户的唯一标识符	-	字符串
`provider`	object	否	调度配置参数	-	对象类型，包含图像生成特有参数和服务商调度参数。图像生成特有参数： - `enable_image_base64` (bool, 默认 `false`): 是否在响应数据的 `data` 字段中同时返回图像的 `Base64` 编码 - `enable_image_origin_data` (bool, 默认 `false`): 是否在响应中包含原始响应数据服务商调度参数：还支持 `only`、`order`、`sort`、`input_price_range`、`output_price_range`、`throughput_range`、`latency_range`、`input_length_range`、`allow_filter_prompt_length`、`ignore`、`allow_fallbacks` 等参数。详细说明请参考：服务商调度参数说明

请求示例

json

{
  "model": "Qwen-Image",
  "prompt": "一只坐着的橘黄色的猫，表情愉悦，活泼可爱，逼真准确",
  "negative_prompt": "低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等",
  "size": "1024x1024",
  "n": 1,
  "steps": 20,
  "seed": 12345,
  "guidance": 4.0,
  "prompt_extend": true,
  "watermark": false,
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    }
  }
}

Qwen-Image-Edit 模型

参数说明

参数名	类型	必填	说明	默认值	取值范围/格式
`prompt`	string	否	图像编辑的描述	-	长度不超过 800 字符，建议填写以获得更好的编辑效果
`image`	string/array	是	需编辑的原图。支持字符串格式（单张图像）或数组格式（多张图像）	-	支持 URL（`http://` 或 `https://`）或 Base64 编码（带 `data:image/{format};base64,` 前缀或不带前缀，支持 PNG、JPEG、JPG 等格式）。数组格式示例：`["url1", "url2", "url3"]` 或 `["base64_1", "base64_2", "base64_3"]`
`image2`	string	否	需编辑的附加图片	-	支持 URL（`http://` 或 `https://`）或 Base64 编码（带 `data:image/{format};base64,` 前缀或不带前缀，支持 PNG、JPEG、JPG 等格式）
`image3`	string	否	需编辑的附加图片	-	支持 URL（`http://` 或 `https://`）或 Base64 编码（带 `data:image/{format};base64,` 前缀或不带前缀，支持 PNG、JPEG、JPG 等格式）
`size`	string	否	支持自定义输出图片分辨率	`1024x1024`	格式：`宽x高`（如 `1024x1024`）或 `宽*高`
`n`	integer	否	生成图片数量	`1`	仅支持 1
`steps`	integer	否	采样步数	-	取值范围为 1-50
`seed`	integer	否	随机种子	-	取值范围 [0, 4294967295]
`guidance`	number	否	指导密度值	-	浮点数
`prompt_extend`	boolean	否	是否开启 prompt 智能改写	`true`	`true`（默认）或 `false`
`watermark`	boolean	否	控制是否添加水印标识	`false`	`true` 或 `false`
`user`	string	否	终端用户的唯一标识符	-	字符串
`provider`	object	否	调度配置参数	-	对象类型，包含图像生成特有参数和服务商调度参数。图像生成特有参数： - `enable_image_base64` (bool, 默认 `false`): 是否在响应数据的 `data` 字段中同时返回图像的 `Base64` 编码 - `enable_image_origin_data` (bool, 默认 `false`): 是否在响应中包含原始响应数据服务商调度参数：还支持 `only`、`order`、`sort`、`input_price_range`、`output_price_range`、`throughput_range`、`latency_range`、`input_length_range`、`allow_filter_prompt_length`、`ignore`、`allow_fallbacks` 等参数。详细说明请参考：服务商调度参数说明

请求示例

json

{
  "model": "Qwen-Image-Edit",
  "prompt": "把猫变成狗",
  "image": "http://example.com/cat.jpg",
  "size": "1024x1024",
  "n": 1,
  "steps": 20,
  "prompt_extend": true,
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    }
  }
}

响应示例

所有模型都返回标准化的响应格式，示例如下：

json

{
  "created": 1736123456,
  "data": [
    {
      "url": "http://qianfan-modelbuilder-img-gen.bj.bcebos.com/qwen-image/xxx.png?authorization=xxx",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."  // 可选字段
    }
  ],
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "text_tokens": 0,
      "image_tokens": 0
    },
    "image_count": 1
  },
  "provider": "百度千帆",
  "model": "Qwen-Image",
  "origin_data": { ... }  // 可选字段
}

说明：

data[].b64_json 字段：仅在 provider.enable_image_base64 设置为 true 时返回。默认值为 false，此时响应中不包含 b64_json 字段
origin_data 字段：包含服务商 API 的完整原始响应数据。可通过设置 provider.enable_image_origin_data 参数控制是否返回此字段（默认值为 false，不会返回）。如需查看不同模型的原始响应格式，请在请求中设置 provider.enable_image_origin_data: true，然后在响应的 origin_data 字段中查看服务商返回的原始数据

响应参数说明

成功响应

所有模型都返回标准化的响应格式，包含以下字段：

参数名	类型	必填	说明	取值范围/格式
`created`	integer	是	响应生成的时间戳（Unix 时间戳）	Unix 时间戳（秒）
`data`	array	是	生成的图片数组	数组对象，每个元素包含：
`data[].url`	string	是	生成的图片 URL，图像格式为 PNG。链接有效期为 24 小时，请及时下载并保存图像	URL 字符串
`data[].b64_json`	string	否	图像的 Base64 编码数据。控制参数：仅在请求参数 `provider.enable_image_base64` 设置为 `true` 时返回此字段。默认值为 `false`，此时不返回此字段	Base64 编码的字符串
`usage`	object	是	使用情况统计	对象类型，包含以下字段：
`usage.total_tokens`	integer	是	总 token 数（图像生成场景通常为 0）	整数
`usage.input_tokens`	integer	是	输入 token 数	整数
`usage.output_tokens`	integer	是	输出 token 数	整数
`usage.input_tokens_details`	object	是	输入 token 详情	对象类型，包含：
`usage.input_tokens_details.text_tokens`	integer	是	文本 token 数	整数
`usage.input_tokens_details.image_tokens`	integer	是	图像 token 数	整数
`usage.image_count`	integer	是	生成的图像数量	整数
`provider`	string	是	实际使用的服务商名称	字符串，例如 "百度千帆"
`model`	string	是	实际使用的模型名称（标准模型名）	字符串
`origin_data`	object	否	服务商的原始响应数据。控制参数：仅在请求参数 `provider.enable_image_origin_data` 设置为 `true` 时返回此字段。默认值为 `false`，此时不返回此字段	对象类型，包含服务商 API 的完整原始响应

错误响应

当 API 调用失败时，会返回服务商的原始错误信息。

错误响应格式：

如果响应是 JSON 格式，返回完整的错误 JSON 对象
如果响应是文本格式，返回错误文本
如果无法解析，返回 HTTP {status_code}

错误响应示例：

json

{
  "code": "InvalidParameter",
  "message": "参数错误",
  "type": "invalid_request_error"
}

注意事项

模型参数限制：不同模型支持的参数不同。对于不在白名单中的参数，系统会记录警告日志，但不会过滤，仍会传递给服务商 API 进行最终判断
参数透传：所有参数（包括 size、image_size、n、batch_size、steps、seed、guidance、prompt_extend、watermark、user 等）都会透传给服务商 API，由服务商进行校验和判断
默认值：如果未提供某些参数，系统会使用模型特定的默认值：
- prompt_extend: true（Qwen-Image 和 Qwen-Image-Edit 默认开启智能改写）
- watermark: false（默认不添加水印）
- size: 1024x1024（所有模型默认分辨率）
- n: 1（所有模型默认值）
- guidance: 4.0（Qwen-Image 默认值）
未知参数处理：未知参数会被记录警告日志，但仍会传递给服务商 API，由服务商判断是否返回错误
服务商调度参数：关于 provider 参数的完整说明和使用示例，请参考服务商调度参数说明

嵌套格式（备选）

除了 OpenAI 标准格式，API 也支持嵌套格式。如果使用嵌套格式，参数分配规则如下：

放入 input 对象的参数：prompt、negative_prompt、image、image2、image3 等图片相关输入参数
放入 extra_body 对象的参数：n、size、steps、seed、guidance、prompt_extend、watermark、user 等生成参数，以及 provider 对象

嵌套格式完整示例

json

{
  "model": "Qwen-Image",
  "input": {
    "prompt": "一只坐着的橘黄色的猫，表情愉悦，活泼可爱，逼真准确",
    "negative_prompt": "低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等"
  },
  "extra_body": {
    "size": "1024x1024",
    "n": 1,
    "steps": 20,
    "seed": 12345,
    "guidance": 4.0,
    "prompt_extend": true,
    "watermark": false,
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    }
  }
}

注意：嵌套格式与 OpenAI 标准格式功能完全等价，系统会自动检测并处理。推荐使用 OpenAI 标准格式以获得更好的兼容性。

图像生成模型

视频生成模型

Vidu

创建视频任务

任务管理

其他任务

可灵 AI

语音生成模型

MiniMax

百度千帆图像生成 API 文档

请求格式

各模型支持的参数

Qwen-Image 模型

参数说明

请求示例

Qwen-Image-Edit 模型

参数说明

请求示例

响应示例

响应参数说明

成功响应

错误响应

注意事项

嵌套格式（备选）

嵌套格式完整示例

Vidu

创建视频任务

任务管理

其他任务

可灵 AI

MiniMax

百度千帆 图像生成 API 文档 ​

请求格式 ​

各模型支持的参数 ​

Qwen-Image 模型 ​

参数说明 ​

请求示例 ​

Qwen-Image-Edit 模型 ​

参数说明 ​

请求示例 ​

响应示例 ​

响应参数说明 ​

成功响应 ​

错误响应 ​

注意事项 ​

嵌套格式（备选） ​

嵌套格式完整示例 ​

百度千帆图像生成 API 文档

请求格式

各模型支持的参数

Qwen-Image 模型

参数说明

请求示例

Qwen-Image-Edit 模型

参数说明

请求示例

响应示例

响应参数说明

成功响应

错误响应

注意事项

嵌套格式（备选）

嵌套格式完整示例