硅基流动图像生成 API 文档

请求格式

图像生成 API 支持 OpenAI 标准格式（推荐），同时也支持嵌套格式。嵌套格式的详细说明请参见文档末尾。

各模型支持的参数

Qwen-Image 模型

参数说明

参数名	类型	必填	说明	默认值	取值范围/格式
`prompt`	string	是	文本提示词，描述要生成的图像内容	-	非空字符串，长度无限制（建议 ≤ 2000 字符）
`negative_prompt`	string	否	负面提示词，描述不希望出现在图像中的内容	-	字符串，长度无限制（建议 ≤ 2000 字符）
`image_size`	string	否	图片尺寸	`1024x1024`	推荐值： `1328x1328` (1:1), `1664x928` (16:9), `928x1664` (9:16), `1472x1140` (4:3), `1140x1472` (3:4), `1584x1056` (3:2), `1056x1584` (2:3)
`num_inference_steps`	integer	否	推理步数	`20`	1 ≤ x ≤ 100
`cfg`	number	否	CFG 参数	`4.0`	0.1 ≤ x ≤ 20
`cfg_scale`	number	否	CFG 参数（与 `cfg` 等效）	-	0.1 ≤ x ≤ 20
`seed`	integer	否	随机种子	-	0 ≤ x ≤ 9999999999
`provider`	object	否	调度配置参数	-	对象类型，包含图像生成特有参数和服务商调度参数。图像生成特有参数： - `enable_image_base64` (bool, 默认 `false`): 是否在响应数据的 `data` 字段中同时返回图像的 `Base64` 编码 - `enable_image_origin_data` (bool, 默认 `false`): 是否在响应中包含原始响应数据服务商调度参数：还支持 `only`、`order`、`sort`、`input_price_range`、`output_price_range`、`throughput_range`、`latency_range`、`input_length_range`、`allow_filter_prompt_length`、`ignore`、`allow_fallbacks` 等参数。详细说明请参考：服务商调度参数说明

请求示例

json

{
  "model": "Qwen-Image",
  "prompt": "a beautiful sunset over the ocean",
  "negative_prompt": "low quality",
  "image_size": "1328x1328",
  "num_inference_steps": 50,
  "cfg": 4.0,
  "seed": 12345,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

Qwen-Image-Edit 模型

参数说明

参数名	类型	必填	说明	默认值	取值范围/格式
`prompt`	string	是	文本提示词，描述要生成的图像内容	-	非空字符串，长度无限制（建议 ≤ 2000 字符）
`image`	string/array	是	参考图像，用于图像编辑。支持字符串格式（单张图像）或数组格式（多张图像）	-	支持 URL（`http://` 或 `https://`）或 Base64 编码（带 `data:image/{format};base64,` 前缀或不带前缀，支持 PNG、JPEG、JPG 等格式）。数组格式示例：`["url1", "url2"]` 或 `["base64_1", "base64_2"]`
`negative_prompt`	string	否	负面提示词，描述不希望出现在图像中的内容	-	字符串，长度无限制（建议 ≤ 2000 字符）
`num_inference_steps`	integer	否	推理步数	`20`	1 ≤ x ≤ 100
`cfg`	number	否	CFG 参数	`4.0`	0.1 ≤ x ≤ 20
`cfg_scale`	number	否	CFG 参数（与 `cfg` 等效）	-	0.1 ≤ x ≤ 20
`seed`	integer	否	随机种子	-	0 ≤ x ≤ 9999999999
`provider`	object	否	调度配置参数	-	对象类型，包含图像生成特有参数和服务商调度参数。图像生成特有参数： - `enable_image_base64` (bool, 默认 `false`): 是否在响应数据的 `data` 字段中同时返回图像的 `Base64` 编码 - `enable_image_origin_data` (bool, 默认 `false`): 是否在响应中包含原始响应数据服务商调度参数：还支持 `only`、`order`、`sort`、`input_price_range`、`output_price_range`、`throughput_range`、`latency_range`、`input_length_range`、`allow_filter_prompt_length`、`ignore`、`allow_fallbacks` 等参数。详细说明请参考：服务商调度参数说明

请求示例

json

{
  "model": "Qwen-Image-Edit",
  "prompt": "make the sky more colorful",
  "image": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA...",
  "negative_prompt": "blurry, low quality",
  "num_inference_steps": 50,
  "cfg": 4.0,
  "seed": 12345,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

Kolors 模型

参数说明

参数名	类型	必填	说明	默认值	取值范围/格式
`prompt`	string	是	文本提示词，描述要生成的图像内容	-	非空字符串，长度无限制（建议 ≤ 2000 字符）
`negative_prompt`	string	否	负面提示词，描述不希望出现在图像中的内容	-	字符串，长度无限制（建议 ≤ 2000 字符）
`image_size`	string	否	图片尺寸	`1024x1024`	推荐值： `1024x1024` (1:1), `960x1280` (3:4), `768x1024` (3:4), `720x1440` (1:2), `720x1280` (9:16)
`batch_size`	integer	否	批次大小（生成图片数量）	`1`	1 ≤ x ≤ 4
`n`	integer	否	生成图片数量（映射到 `batch_size`）	-	1 ≤ x ≤ 4
`num_inference_steps`	integer	否	推理步数	`20`	1 ≤ x ≤ 100
`guidance_scale`	number	否	引导比例	`7.5`	0 ≤ x ≤ 20
`seed`	integer	否	随机种子	-	0 ≤ x ≤ 9999999999
`provider`	object	否	调度配置参数	-	对象类型，包含图像生成特有参数和服务商调度参数。图像生成特有参数： - `enable_image_base64` (bool, 默认 `false`): 是否在响应数据的 `data` 字段中同时返回图像的 `Base64` 编码 - `enable_image_origin_data` (bool, 默认 `false`): 是否在响应中包含原始响应数据服务商调度参数：还支持 `only`、`order`、`sort`、`input_price_range`、`output_price_range`、`throughput_range`、`latency_range`、`input_length_range`、`allow_filter_prompt_length`、`ignore`、`allow_fallbacks` 等参数。详细说明请参考：服务商调度参数说明

请求示例

json

{
  "model": "Kolors",
  "prompt": "a beautiful sunset over the ocean",
  "negative_prompt": "blurry, low quality",
  "image_size": "1024x1024",
  "batch_size": 2,
  "num_inference_steps": 20,
  "guidance_scale": 7.5,
  "seed": 12345,
  "provider": {
    "enable_image_base64": false,
    "enable_image_origin_data": true
  }
}

响应示例

所有模型都返回标准化的响应格式，示例如下：

json

{
  "created": 1736123456,
  "data": [
    {
      "url": "https://example.com/generated-image-1.png",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."  // 可选字段
    }
  ],
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "text_tokens": 0,
      "image_tokens": 0
    },
    "image_count": 1
  },
  "provider": "硅基流动",
  "model": "Qwen-Image",
  "origin_data": { ... }  // 可选字段
}

说明：

data[].b64_json 字段：仅在 extra_body.provider.enable_image_base64 设置为 true 时返回。默认值为 false，此时响应中不包含 b64_json 字段
origin_data 字段：包含服务商 API 的完整原始响应数据。可通过设置 extra_body.provider.enable_image_origin_data 参数控制是否返回此字段（默认值为 false，不会返回）。如需查看不同模型的原始响应格式，请在请求中设置 extra_body.provider.enable_image_origin_data: true，然后在响应的 origin_data 字段中查看服务商返回的原始数据

响应参数说明

成功响应

参数名	类型	必填	说明	取值范围/格式
`created`	integer	是	响应创建时间，Unix 时间戳（秒）	整数，Unix 时间戳（秒）
`data`	array	是	生成的图像数据数组	数组对象，每个元素包含图像信息
`data[].url`	string	是	生成的图像 URL	URL 字符串
`data[].b64_json`	string	否	图像的 Base64 编码数据。控制参数：仅在请求参数 `extra_body.provider.enable_image_base64` 设置为 `true` 时返回此字段。默认值为 `false`，此时不返回此字段	Base64 编码的字符串
`usage`	object	是	使用情况统计	对象类型
`usage.total_tokens`	integer	是	总 token 数	整数，图像生成场景通常为 0
`usage.input_tokens`	integer	是	输入 token 数	整数，图像生成场景通常为 0
`usage.output_tokens`	integer	是	输出 token 数	整数，图像生成场景通常为 0
`usage.input_tokens_details`	object	是	输入 token 详情	对象类型
`usage.input_tokens_details.text_tokens`	integer	是	文本 token 数	整数，图像生成场景通常为 0
`usage.input_tokens_details.image_tokens`	integer	是	图像 token 数	整数，图像生成场景通常为 0
`usage.image_count`	integer	是	生成的图像数量	整数，大于等于 1
`provider`	string	是	服务商名称	字符串，如"硅基流动"
`model`	string	是	模型名称	字符串，如"Qwen-Image"
`origin_data`	object	否	服务商的原始响应数据。控制参数：仅在请求参数 `extra_body.provider.enable_image_origin_data` 设置为 `true` 时返回此字段。默认值为 `false`，此时不返回此字段	对象类型，包含服务商 API 的完整原始响应

错误响应

当 API 调用失败时，会返回服务商的原始错误信息。

错误响应格式：

如果响应是 JSON 格式，返回完整的错误 JSON 对象
如果响应是文本格式，返回错误文本
如果无法解析，返回 HTTP {status_code}

错误响应示例：

json

{
  "error": {
    "message": "Invalid parameter",
    "code": "invalid_param"
  }
}

注意事项

模型参数限制：不同模型支持的参数不同。对于不在白名单中的参数，系统会记录警告日志，但不会过滤，仍会传递给服务商 API 进行最终判断
参数透传：所有参数（包括 cfg、cfg_scale、guidance_scale、image_size 等）都会透传给服务商 API，由服务商进行校验和判断
图片格式支持：支持的图片格式（通过文件头自动检测）：
- JPEG/JPG: 文件头 FF D8 FF
- PNG: 文件头 89 50 4E 47 0D 0A 1A 0A
- GIF: 文件头 GIF87a 或 GIF89a
- WebP: 文件头 RIFF + WEBP
- BMP: 文件头 BM
- TIFF: 文件头 II 2A 00 (小端) 或 4D 4D 00 2A (大端) 系统会根据文件头自动检测图片格式并设置正确的 MIME 类型
默认值：如果未提供某些参数，系统会使用模型特定的默认值：
- image_size: 1024x1024（不支持该参数的模型除外）
- batch_size: 1（仅适用于 Kolors 模型）
- num_inference_steps: 20
- cfg: 4.0（Qwen 系列模型）
- guidance_scale: 7.5（Kolors 模型）
未知参数处理：未知参数会被记录警告日志，但仍会传递给服务商 API，由服务商判断是否返回错误
服务商调度参数：关于 provider 参数的完整说明和使用示例，请参考服务商调度参数说明

嵌套格式（备选）

除了 OpenAI 标准格式，API 也支持嵌套格式。如果使用嵌套格式，参数分配规则如下：

放入 input 对象的参数：prompt、negative_prompt、image、image2、image3 等图片相关输入参数
放入 extra_body 对象的参数：n、image_size、batch_size、num_inference_steps、cfg、cfg_scale、guidance_scale、seed 等生成参数，以及 provider 对象

嵌套格式完整示例

json

{
  "model": "Qwen-Image",
  "input": {
    "prompt": "a beautiful sunset over the ocean",
    "negative_prompt": "low quality"
  },
  "extra_body": {
    "image_size": "1328x1328",
    "num_inference_steps": 50,
    "cfg": 4.0,
    "seed": 12345,
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    }
  }
}

注意：嵌套格式与 OpenAI 标准格式功能完全等价，系统会自动检测并处理。推荐使用 OpenAI 标准格式以获得更好的兼容性。

图像生成模型

视频生成模型

硅基流动图像生成 API 文档

请求格式

各模型支持的参数

Qwen-Image 模型

参数说明

请求示例

Qwen-Image-Edit 模型

参数说明

请求示例

Kolors 模型

参数说明

请求示例

响应示例

响应参数说明

成功响应

错误响应

注意事项

嵌套格式（备选）

嵌套格式完整示例

硅基流动 图像生成 API 文档 ​

请求格式 ​

各模型支持的参数 ​

Qwen-Image 模型 ​

参数说明 ​

请求示例 ​

Qwen-Image-Edit 模型 ​

参数说明 ​

请求示例 ​

Kolors 模型 ​

参数说明 ​

请求示例 ​

响应示例 ​

响应参数说明 ​

成功响应 ​

错误响应 ​

注意事项 ​

嵌套格式（备选） ​

嵌套格式完整示例 ​

硅基流动图像生成 API 文档

请求格式

各模型支持的参数

Qwen-Image 模型

参数说明

请求示例

Qwen-Image-Edit 模型

参数说明

请求示例

Kolors 模型

参数说明

请求示例

响应示例

响应参数说明

成功响应

错误响应

注意事项

嵌套格式（备选）

嵌套格式完整示例