Skip to content

硅基流动 图像生成 API 文档

各模型支持的参数

Qwen-Image 模型

Input 参数

参数名类型必填说明取值范围/格式
promptstring文本提示词,描述要生成的图像内容非空字符串,长度无限制(建议 ≤ 2000 字符)
negative_promptstring负面提示词,描述不希望出现在图像中的内容字符串,长度无限制(建议 ≤ 2000 字符)

ExtraBody 参数

参数名类型必填说明默认值取值范围/格式
image_sizestring图片尺寸1024x1024推荐值:
1328x1328 (1:1),
1664x928 (16:9),
928x1664 (9:16),
1472x1140 (4:3),
1140x1472 (3:4),
1584x1056 (3:2),
1056x1584 (2:3)
num_inference_stepsinteger推理步数201 ≤ x ≤ 100
cfgnumberCFG 参数4.00.1 ≤ x ≤ 20
cfg_scalenumberCFG 参数(与 cfg 等效)-0.1 ≤ x ≤ 20
seedinteger随机种子-0 ≤ x ≤ 9999999999
providerobject调度配置参数-对象类型,包含图像生成特有参数和供应商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

供应商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:供应商调度参数说明

请求示例

json
{
  "model": "Qwen-Image",
  "input": {
    "prompt": "a beautiful sunset over the ocean",
    "negative_prompt": "low quality"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "image_size": "1328x1328",
    "num_inference_steps": 50,
    "cfg": 4.0,
    "seed": 12345
  }
}

Qwen-Image-Edit 模型

Input 参数

参数名类型必填说明取值范围/格式
promptstring文本提示词,描述要生成的图像内容非空字符串,长度无限制(建议 ≤ 2000 字符)
imagestring/array参考图像,用于图像编辑。支持字符串格式(单张图像)或数组格式(多张图像)支持 URL(http://https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。数组格式示例:["url1", "url2"]["base64_1", "base64_2"]
negative_promptstring负面提示词,描述不希望出现在图像中的内容字符串,长度无限制(建议 ≤ 2000 字符)

ExtraBody 参数

参数名类型必填说明默认值取值范围/格式
num_inference_stepsinteger推理步数201 ≤ x ≤ 100
cfgnumberCFG 参数4.00.1 ≤ x ≤ 20
cfg_scalenumberCFG 参数(与 cfg 等效)-0.1 ≤ x ≤ 20
seedinteger随机种子-0 ≤ x ≤ 9999999999
providerobject调度配置参数-对象类型,包含图像生成特有参数和供应商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

供应商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:供应商调度参数说明

请求示例

json
{
  "model": "Qwen-Image-Edit",
  "input": {
    "prompt": "make the sky more colorful",
    "image": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAA...",
    "negative_prompt": "blurry, low quality"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "num_inference_steps": 50,
    "cfg": 4.0,
    "seed": 12345
  }
}

Kolors 模型

Input 参数

参数名类型必填说明取值范围/格式
promptstring文本提示词,描述要生成的图像内容非空字符串,长度无限制(建议 ≤ 2000 字符)
negative_promptstring负面提示词,描述不希望出现在图像中的内容字符串,长度无限制(建议 ≤ 2000 字符)

ExtraBody 参数

参数名类型必填说明默认值取值范围/格式
image_sizestring图片尺寸1024x1024推荐值:
1024x1024 (1:1),
960x1280 (3:4),
768x1024 (3:4),
720x1440 (1:2),
720x1280 (9:16)
batch_sizeinteger批次大小(生成图片数量)11 ≤ x ≤ 4
ninteger生成图片数量(映射到 batch_size-1 ≤ x ≤ 4
num_inference_stepsinteger推理步数201 ≤ x ≤ 100
guidance_scalenumber引导比例7.50 ≤ x ≤ 20
seedinteger随机种子-0 ≤ x ≤ 9999999999
providerobject调度配置参数-对象类型,包含图像生成特有参数和供应商调度参数。

图像生成特有参数
- enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码
- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据

供应商调度参数:还支持 onlyordersortinput_price_rangeoutput_price_rangethroughput_rangelatency_rangeinput_length_rangeallow_filter_prompt_lengthignoreallow_fallbacks 等参数。

详细说明请参考:供应商调度参数说明

请求示例

json
{
  "model": "Kolors",
  "input": {
    "prompt": "a beautiful sunset over the ocean",
    "negative_prompt": "blurry, low quality"
  },
  "extra_body": {
    "provider": {
      "enable_image_base64": false,
      "enable_image_origin_data": true
    },
    "image_size": "1024x1024",
    "batch_size": 2,
    "num_inference_steps": 20,
    "guidance_scale": 7.5,
    "seed": 12345
  }
}

响应示例

所有模型都返回标准化的响应格式,示例如下:

json
{
  "created": 1736123456,
  "data": [
    {
      "url": "https://example.com/generated-image-1.png",
      "b64_json": "iVBORw0KGgoAAAANSUhEUgAA..."  // 可选字段
    }
  ],
  "usage": {
    "total_tokens": 0,
    "input_tokens": 0,
    "output_tokens": 0,
    "input_tokens_details": {
      "text_tokens": 0,
      "image_tokens": 0
    },
    "image_count": 1
  },
  "provider": "硅基流动",
  "model": "Qwen-Image",
  "origin_data": { ... }  // 可选字段
}

说明

  • data[].b64_json 字段:仅在 extra_body.provider.enable_image_base64 设置为 true 时返回。默认值为 false,此时响应中不包含 b64_json 字段
  • origin_data 字段:包含供应商 API 的完整原始响应数据。可通过设置 extra_body.provider.enable_image_origin_data 参数控制是否返回此字段(默认值为 false,不会返回)。如需查看不同模型的原始响应格式,请在请求中设置 extra_body.provider.enable_image_origin_data: true,然后在响应的 origin_data 字段中查看供应商返回的原始数据

响应参数说明

成功响应

参数名类型必填说明取值范围/格式
createdinteger响应创建时间,Unix 时间戳(秒)整数,Unix 时间戳(秒)
dataarray生成的图像数据数组数组对象,每个元素包含图像信息
data[].urlstring生成的图像 URLURL 字符串
data[].b64_jsonstring图像的 Base64 编码数据。控制参数:仅在请求参数 extra_body.provider.enable_image_base64 设置为 true 时返回此字段。默认值为 false,此时不返回此字段Base64 编码的字符串
usageobject使用情况统计对象类型
usage.total_tokensinteger总 token 数整数,图像生成场景通常为 0
usage.input_tokensinteger输入 token 数整数,图像生成场景通常为 0
usage.output_tokensinteger输出 token 数整数,图像生成场景通常为 0
usage.input_tokens_detailsobject输入 token 详情对象类型
usage.input_tokens_details.text_tokensinteger文本 token 数整数,图像生成场景通常为 0
usage.input_tokens_details.image_tokensinteger图像 token 数整数,图像生成场景通常为 0
usage.image_countinteger生成的图像数量整数,大于等于 1
providerstring供应商名称字符串,如"硅基流动"
modelstring模型名称字符串,如"Qwen-Image"
origin_dataobject供应商的原始响应数据。控制参数:仅在请求参数 extra_body.provider.enable_image_origin_data 设置为 true 时返回此字段。默认值为 false,此时不返回此字段对象类型,包含供应商 API 的完整原始响应

错误响应

当 API 调用失败时,会返回供应商的原始错误信息。

错误响应格式

  • 如果响应是 JSON 格式,返回完整的错误 JSON 对象
  • 如果响应是文本格式,返回错误文本
  • 如果无法解析,返回 HTTP {status_code}

错误响应示例

json
{
  "error": {
    "message": "Invalid parameter",
    "code": "invalid_param"
  }
}

注意事项

  1. 模型参数限制:不同模型支持的参数不同。对于不在白名单中的参数,系统会记录警告日志,但不会过滤,仍会传递给供应商 API 进行最终判断

  2. 参数透传:所有参数(包括 cfgcfg_scaleguidance_scaleimage_size 等)都会透传给供应商 API,由供应商进行校验和判断

  3. 图片格式支持:支持的图片格式(通过文件头自动检测):

    • JPEG/JPG: 文件头 FF D8 FF
    • PNG: 文件头 89 50 4E 47 0D 0A 1A 0A
    • GIF: 文件头 GIF87aGIF89a
    • WebP: 文件头 RIFF + WEBP
    • BMP: 文件头 BM
    • TIFF: 文件头 II 2A 00 (小端) 或 4D 4D 00 2A (大端) 系统会根据文件头自动检测图片格式并设置正确的 MIME 类型
  4. 默认值:如果未提供某些参数,系统会使用模型特定的默认值:

    • image_size: 1024x1024(不支持该参数的模型除外)
    • batch_size: 1(仅适用于 Kolors 模型)
    • num_inference_steps: 20
    • cfg: 4.0(Qwen 系列模型)
    • guidance_scale: 7.5(Kolors 模型)
  5. 未知参数处理:未知参数会被记录警告日志,但仍会传递给供应商 API,由供应商判断是否返回错误

  6. 供应商调度参数:关于 extra_body.provider 参数的完整说明和使用示例,请参考供应商调度参数说明