主题模式
硅基流动 图像生成 API 文档
各模型支持的参数
Qwen-Image 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 文本提示词,描述要生成的图像内容 | 非空字符串,长度无限制(建议 ≤ 2000 字符) |
negative_prompt | string | 否 | 负面提示词,描述不希望出现在图像中的内容 | 字符串,长度无限制(建议 ≤ 2000 字符) |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
image_size | string | 否 | 图片尺寸 | 1024x1024 | 推荐值:1328x1328 (1:1),1664x928 (16:9),928x1664 (9:16),1472x1140 (4:3),1140x1472 (3:4),1584x1056 (3:2),1056x1584 (2:3) |
num_inference_steps | integer | 否 | 推理步数 | 20 | 1 ≤ x ≤ 100 |
cfg | number | 否 | CFG 参数 | 4.0 | 0.1 ≤ x ≤ 20 |
cfg_scale | number | 否 | CFG 参数(与 cfg 等效) | - | 0.1 ≤ x ≤ 20 |
seed | integer | 否 | 随机种子 | - | 0 ≤ x ≤ 9999999999 |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
请求示例
json
{
"model": "Qwen-Image",
"input": {
"prompt": "a beautiful sunset over the ocean",
"negative_prompt": "low quality"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"image_size": "1328x1328",
"num_inference_steps": 50,
"cfg": 4.0,
"seed": 12345
}
}Qwen-Image-Edit 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 文本提示词,描述要生成的图像内容 | 非空字符串,长度无限制(建议 ≤ 2000 字符) |
image | string/array | 是 | 参考图像,用于图像编辑。支持字符串格式(单张图像)或数组格式(多张图像) | 支持 URL(http:// 或 https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。数组格式示例:["url1", "url2"] 或 ["base64_1", "base64_2"] |
negative_prompt | string | 否 | 负面提示词,描述不希望出现在图像中的内容 | 字符串,长度无限制(建议 ≤ 2000 字符) |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
num_inference_steps | integer | 否 | 推理步数 | 20 | 1 ≤ x ≤ 100 |
cfg | number | 否 | CFG 参数 | 4.0 | 0.1 ≤ x ≤ 20 |
cfg_scale | number | 否 | CFG 参数(与 cfg 等效) | - | 0.1 ≤ x ≤ 20 |
seed | integer | 否 | 随机种子 | - | 0 ≤ x ≤ 9999999999 |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
请求示例
json
{
"model": "Qwen-Image-Edit",
"input": {
"prompt": "make the sky more colorful",
"image": "...",
"negative_prompt": "blurry, low quality"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"num_inference_steps": 50,
"cfg": 4.0,
"seed": 12345
}
}Kolors 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 文本提示词,描述要生成的图像内容 | 非空字符串,长度无限制(建议 ≤ 2000 字符) |
negative_prompt | string | 否 | 负面提示词,描述不希望出现在图像中的内容 | 字符串,长度无限制(建议 ≤ 2000 字符) |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
image_size | string | 否 | 图片尺寸 | 1024x1024 | 推荐值:1024x1024 (1:1),960x1280 (3:4),768x1024 (3:4),720x1440 (1:2),720x1280 (9:16) |
batch_size | integer | 否 | 批次大小(生成图片数量) | 1 | 1 ≤ x ≤ 4 |
n | integer | 否 | 生成图片数量(映射到 batch_size) | - | 1 ≤ x ≤ 4 |
num_inference_steps | integer | 否 | 推理步数 | 20 | 1 ≤ x ≤ 100 |
guidance_scale | number | 否 | 引导比例 | 7.5 | 0 ≤ x ≤ 20 |
seed | integer | 否 | 随机种子 | - | 0 ≤ x ≤ 9999999999 |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
请求示例
json
{
"model": "Kolors",
"input": {
"prompt": "a beautiful sunset over the ocean",
"negative_prompt": "blurry, low quality"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"image_size": "1024x1024",
"batch_size": 2,
"num_inference_steps": 20,
"guidance_scale": 7.5,
"seed": 12345
}
}响应示例
所有模型都返回标准化的响应格式,示例如下:
json
{
"created": 1736123456,
"data": [
{
"url": "https://example.com/generated-image-1.png",
"b64_json": "iVBORw0KGgoAAAANSUhEUgAA..." // 可选字段
}
],
"usage": {
"total_tokens": 0,
"input_tokens": 0,
"output_tokens": 0,
"input_tokens_details": {
"text_tokens": 0,
"image_tokens": 0
},
"image_count": 1
},
"provider": "硅基流动",
"model": "Qwen-Image",
"origin_data": { ... } // 可选字段
}说明:
data[].b64_json字段:仅在extra_body.provider.enable_image_base64设置为true时返回。默认值为false,此时响应中不包含b64_json字段origin_data字段:包含供应商 API 的完整原始响应数据。可通过设置extra_body.provider.enable_image_origin_data参数控制是否返回此字段(默认值为false,不会返回)。如需查看不同模型的原始响应格式,请在请求中设置extra_body.provider.enable_image_origin_data: true,然后在响应的origin_data字段中查看供应商返回的原始数据
响应参数说明
成功响应
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
created | integer | 是 | 响应创建时间,Unix 时间戳(秒) | 整数,Unix 时间戳(秒) |
data | array | 是 | 生成的图像数据数组 | 数组对象,每个元素包含图像信息 |
data[].url | string | 是 | 生成的图像 URL | URL 字符串 |
data[].b64_json | string | 否 | 图像的 Base64 编码数据。控制参数:仅在请求参数 extra_body.provider.enable_image_base64 设置为 true 时返回此字段。默认值为 false,此时不返回此字段 | Base64 编码的字符串 |
usage | object | 是 | 使用情况统计 | 对象类型 |
usage.total_tokens | integer | 是 | 总 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens | integer | 是 | 输入 token 数 | 整数,图像生成场景通常为 0 |
usage.output_tokens | integer | 是 | 输出 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens_details | object | 是 | 输入 token 详情 | 对象类型 |
usage.input_tokens_details.text_tokens | integer | 是 | 文本 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens_details.image_tokens | integer | 是 | 图像 token 数 | 整数,图像生成场景通常为 0 |
usage.image_count | integer | 是 | 生成的图像数量 | 整数,大于等于 1 |
provider | string | 是 | 供应商名称 | 字符串,如"硅基流动" |
model | string | 是 | 模型名称 | 字符串,如"Qwen-Image" |
origin_data | object | 否 | 供应商的原始响应数据。控制参数:仅在请求参数 extra_body.provider.enable_image_origin_data 设置为 true 时返回此字段。默认值为 false,此时不返回此字段 | 对象类型,包含供应商 API 的完整原始响应 |
错误响应
当 API 调用失败时,会返回供应商的原始错误信息。
错误响应格式:
- 如果响应是 JSON 格式,返回完整的错误 JSON 对象
- 如果响应是文本格式,返回错误文本
- 如果无法解析,返回
HTTP {status_code}
错误响应示例:
json
{
"error": {
"message": "Invalid parameter",
"code": "invalid_param"
}
}注意事项
模型参数限制:不同模型支持的参数不同。对于不在白名单中的参数,系统会记录警告日志,但不会过滤,仍会传递给供应商 API 进行最终判断
参数透传:所有参数(包括
cfg、cfg_scale、guidance_scale、image_size等)都会透传给供应商 API,由供应商进行校验和判断图片格式支持:支持的图片格式(通过文件头自动检测):
- JPEG/JPG: 文件头
FF D8 FF - PNG: 文件头
89 50 4E 47 0D 0A 1A 0A - GIF: 文件头
GIF87a或GIF89a - WebP: 文件头
RIFF+WEBP - BMP: 文件头
BM - TIFF: 文件头
II 2A 00(小端) 或4D 4D 00 2A(大端) 系统会根据文件头自动检测图片格式并设置正确的 MIME 类型
- JPEG/JPG: 文件头
默认值:如果未提供某些参数,系统会使用模型特定的默认值:
image_size:1024x1024(不支持该参数的模型除外)batch_size:1(仅适用于 Kolors 模型)num_inference_steps:20cfg:4.0(Qwen 系列模型)guidance_scale:7.5(Kolors 模型)
未知参数处理:未知参数会被记录警告日志,但仍会传递给供应商 API,由供应商判断是否返回错误
供应商调度参数:关于
extra_body.provider参数的完整说明和使用示例,请参考供应商调度参数说明