主题模式
火山引擎 图像生成 API 文档
各模型支持的参数
Seedream 4.0 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 用于生成图像的提示词,中英文输入均可 | 非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比 |
image | string/array | 否 | 第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张) | 支持 URL(http:// 或 https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...] 或 ["base64_1", "base64_2", ...]。多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 image、image2、image3...image10 等参数分别传入 |
image2 | string | 否 | 第二张参考图像(多图融合时使用) | 同 image 参数要求 |
| ... | ... | ... | ... | ... |
image10 | string | 否 | 第十张参考图像(多图融合时使用) | 同 image 参数要求 |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
size | string/integer | 否 | 指定生成图像的尺寸信息,支持以下两种方式,不可混用。 方式 1:指定生成图像的分辨率,并在 prompt 中用自然语言描述图片宽高比、图片形状或图片用途,最终由模型判断生成图片的大小。可选值: 1K、2K、4K方式 2:指定生成图像的宽高像素值。总像素取值范围:[1280x720=921600, 4096x4096=16777216],宽高比取值范围:[1/16, 16]。需同时满足总像素取值范围和宽高比取值范围,其中总像素是对宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制。详见下方推荐宽高像素值 | 2048x2048 | 方式 1:1K、2K、4K方式 2:总像素范围 [921600, 16777216],宽高比范围 [1/16, 16] |
width | integer | 否 | 生成图像宽度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
height | integer | 否 | 生成图像高度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
scale | float | 否 | 文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小 | 0.5 | 取值范围:[0, 1],精度:支持小数点后两位 |
force_single | boolean | 否 | 是否强制生成单图。若对延迟&价格敏感,建议使用该参数 | false | 布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长 |
min_ratio | float | 否 | 生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio | 0.333 (1/3) | 取值范围:[1/16, 16) |
max_ratio | float | 否 | 生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio | 3 | 取值范围:[1/16, 16) |
optimize_prompt_options | object | 否 | 提示词优化配置参数 | - | 对象类型,包含以下可选字段: - mode (string, 默认 standard): 设置提示词优化功能使用的模式。standard:标准模式,生成内容的质量更高,耗时较长;fast:快速模式,生成内容的耗时更短,质量一般 |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
推荐宽高像素值
有效示例:1600x600
- 总像素值 1600x600=960000,符合 [921600, 16777216] 的区间要求
- 宽高比 1600/600=8/3,符合 [1/16, 16] 的区间要求,故该示例值有效
无效示例:800x800
- 总像素值 800x800=640000,未达到 921600 的最低要求
- 宽高 800/800=1,虽符合 [1/16, 16] 的区间要求,但因其未同时满足两项限制,故该示例值无效
推荐宽高组合:
| 分辨率 | 宽度 | 高度 | 宽高比 | 总像素 |
|---|---|---|---|---|
| 1K | 1024 | 1024 | 1:1 | 1048576 |
| 2K | 2048 | 2048 | 1:1 | 4194304 |
| 2K | 2304 | 1728 | 4:3 | 3981312 |
| 2K | 2496 | 1664 | 3:2 | 4153344 |
| 2K | 2560 | 1440 | 16:9 | 3686400 |
| 2K | 3024 | 1296 | 21:9 | 3919104 |
| 4K | 4096 | 4096 | 1:1 | 16777216 |
| 4K | 4694 | 3520 | 4:3 | 16522880 |
| 4K | 4992 | 3328 | 3:2 | 16613376 |
| 4K | 5404 | 3040 | 16:9 | 16428160 |
| 4K | 6198 | 2656 | 21:9 | 16461888 |
请求示例
文生图示例:
json
{
"model": "Doubao-Seedream-4.0",
"input": {
"prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"size": "2K",
"scale": 0.5,
"force_single": false,
"optimize_prompt_options": {
"mode": "standard"
}
}
}图生图示例:
json
{
"model": "Doubao-Seedream-4.0",
"input": {
"prompt": "背景换成演唱会现场",
"image": "https://example.com/reference-image.jpg"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"scale": 0.6,
"width": 2048,
"height": 2048,
"optimize_prompt_options": {
"mode": "fast"
}
}
}Seedream 4.5 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 用于生成图像的提示词,中英文输入均可 | 非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比 |
image | string/array | 否 | 第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张) | 支持 URL(http:// 或 https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...] 或 ["base64_1", "base64_2", ...]。多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 image、image2、image3...image10 等参数分别传入 |
image2 | string | 否 | 第二张参考图像(多图融合时使用) | 同 image 参数要求 |
| ... | ... | ... | ... | ... |
image10 | string | 否 | 第十张参考图像(多图融合时使用) | 同 image 参数要求 |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
size | string/integer | 否 | 指定生成图像的尺寸信息,支持以下两种方式,不可混用。 方式 1:指定生成图像的分辨率,并在 prompt 中用自然语言描述图片宽高比、图片形状或图片用途,最终由模型判断生成图片的大小。可选值: 2K、4K方式 2:指定生成图像的宽高像素值。总像素取值范围:[2560x1440=3686400, 4096x4096=16777216],宽高比取值范围:[1/16, 16]。需同时满足总像素取值范围和宽高比取值范围,其中总像素是对宽度和高度的像素乘积限制,而不是对宽度或高度的单独值进行限制。详见下方有效示例和无效示例 | 2048x2048 | 方式 1:2K、4K方式 2:总像素范围 [3686400, 16777216],宽高比范围 [1/16, 16] |
width | integer | 否 | 生成图像宽度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
height | integer | 否 | 生成图像高度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
scale | float | 否 | 文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小 | 0.5 | 取值范围:[0, 1],精度:支持小数点后两位 |
force_single | boolean | 否 | 是否强制生成单图。若对延迟&价格敏感,建议使用该参数 | false | 布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长 |
min_ratio | float | 否 | 生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio | 0.333 (1/3) | 取值范围:[1/16, 16) |
max_ratio | float | 否 | 生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio | 3 | 取值范围:[1/16, 16) |
optimize_prompt_options | object | 否 | 提示词优化配置参数 | - | 对象类型,包含以下可选字段: - mode (string, 默认 standard): 设置提示词优化功能使用的模式。standard:标准模式,生成内容的质量更高,耗时较长;fast:快速模式,生成内容的耗时更短,质量一般 |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
有效示例和无效示例
有效示例:3750x1250
- 总像素值 3750x1250=4687500,符合 [3686400, 16777216] 的区间要求
- 宽高比 3750/1250=3,符合 [1/16, 16] 的区间要求,故该示例值有效
无效示例:1500x1500
- 总像素值 1500x1500=2250000,未达到 3686400 的最低要求
- 宽高 1500/1500=1,虽符合 [1/16, 16] 的区间要求,但因其未同时满足两项限制,故该示例值无效
推荐的宽高像素值
| 宽高比 | 宽高像素值 |
|---|---|
| 1:1 | 2048x2048 |
| 4:3 | 2304x1728 |
| 3:4 | 1728x2304 |
| 16:9 | 2560x1440 |
| 9:16 | 1440x2560 |
| 3:2 | 2496x1664 |
| 2:3 | 1664x2496 |
| 21:9 | 3024x1296 |
请求示例
文生图示例:
json
{
"model": "Doubao-Seedream-4.5",
"input": {
"prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"size": "2K",
"scale": 0.5,
"force_single": false,
"optimize_prompt_options": {
"mode": "standard"
}
}
}图生图示例:
json
{
"model": "Doubao-Seedream-4.5",
"input": {
"prompt": "背景换成演唱会现场",
"image": "https://example.com/reference-image.jpg"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"scale": 0.6,
"width": 2048,
"height": 2048,
"optimize_prompt_options": {
"mode": "fast"
}
}
}即梦图片生成 4.0 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 用于生成图像的提示词,中英文输入均可 | 非空字符串,最长不超过 800 字符。建议:除 "" 外不建议输入特殊的符号如 $;支持 prompt 中直接指定生图比例,模型会根据 size 字段智能判断生图宽高比 |
image | string/array | 否 | 第一张参考图像,用于图生图。支持字符串格式(单张图像)或数组格式(多张图像,最多 10 张) | 支持 URL(http:// 或 https://)或 Base64 编码(带 data:image/{format};base64, 前缀或不带前缀,支持 PNG、JPEG、JPG 等格式)。图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式;图片文件大小:最大 15 MB;图片分辨率:最大 4096*4096;输入图宽高比:(宽/高)范围:[1/3, 3]。数组格式示例:["url1", "url2", ...] 或 ["base64_1", "base64_2", ...]。多图输入说明:支持最多输入 10 张图,可通过 image 数组格式传入,或通过 image、image2、image3...image10 等参数分别传入 |
image2 | string | 否 | 第二张参考图像(多图融合时使用) | 同 image 参数要求 |
| ... | ... | ... | ... | ... |
image10 | string | 否 | 第十张参考图像(多图融合时使用) | 同 image 参数要求 |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
size | integer | 否 | 生成图片的面积,模型会根据用户 prompt 意图智能判断生图宽高比 | 4194304 (2048*2048,即 2K 分辨率) | 取值范围:[1024*1024, 4096*4096],可生成 1K 到 4K 分辨率图像。 |
width | integer | 否 | 生成图像宽度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
height | integer | 否 | 生成图像高度,需同时传 width 和 height 才会生效 | - | 宽高乘积在 [1024*1024, 4096*4096],且宽高比在 [min_ratio, max_ratio] 之间。详见下方推荐宽高 |
scale | float | 否 | 文本描述影响的程度,该值越大代表文本描述影响程度越大,且输入图片影响程度越小 | 0.5 | 取值范围:[0, 1],精度:支持小数点后两位 |
force_single | boolean | 否 | 是否强制生成单图。若对延迟&价格敏感,建议使用该参数 | false | 布尔值。注意:生成的组图越多,耗时越久,且生成耗时会随图片数量增多而显著变长 |
min_ratio | float | 否 | 生图结果的宽/高 ≥ min_ratio,如果智能选比例 < min_ratio,则用 min_ratio | 0.333 (1/3) | 取值范围:[1/16, 16) |
max_ratio | float | 否 | 生图结果的宽/高 ≤ max_ratio,如果智能选比例 > max_ratio,则用 max_ratio | 3 | 取值范围:[1/16, 16) |
provider | object | 否 | 调度配置参数 | - | 对象类型,包含图像生成特有参数和供应商调度参数。 图像生成特有参数: - enable_image_base64 (bool, 默认 false): 是否在响应数据的 data 字段中同时返回图像的 Base64 编码- enable_image_origin_data (bool, 默认 false): 是否在响应中包含原始响应数据供应商调度参数:还支持 only、order、sort、input_price_range、output_price_range、throughput_range、latency_range、input_length_range、allow_filter_prompt_length、ignore、allow_fallbacks 等参数。详细说明请参考:供应商调度参数说明 |
推荐宽高组合
1K 分辨率:
- 1024x1024 (1:1)
2K 分辨率:
- 2048x2048 (1:1)
- 2304x1728 (4:3)
- 2496x1664 (3:2)
- 2560x1440 (16:9)
- 3024x1296 (21:9)
4K 分辨率:
- 4096x4096 (1:1)
- 4694x3520 (4:3)
- 4992x3328 (3:2)
- 5404x3040 (16:9)
- 6198x2656 (21:9)
请求示例
文生图示例:
json
{
"model": "即梦图片生成 4.0",
"input": {
"prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"size": 4194304,
"scale": 0.5,
"force_single": false
}
}图生图示例:
json
{
"model": "即梦图片生成 4.0",
"input": {
"prompt": "背景换成演唱会现场",
"image": "https://example.com/reference-image.jpg"
},
"extra_body": {
"provider": {
"enable_image_base64": false,
"enable_image_origin_data": true
},
"scale": 0.6,
"width": 2048,
"height": 2048
}
}即梦文生图 3.1 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 用于生成图像的提示词,中英文均可输入。建议长度<=120字符,最长不超过800字符,prompt过长有概率出图异常或不生效 | 非空字符串,最长不超过 800 字符 |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
use_pre_llm | bool | 否 | 开启文本扩写,会针对输入prompt进行扩写优化,如果输入prompt较短建议开启,如果输入prompt较长建议关闭 | true | 布尔值 |
seed | int | 否 | 随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致 | -1 | 整数,-1 表示随机 |
width | int | 否 | 生成图像宽度,需同时传 width 和 height 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合 | - | 宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间 |
height | int | 否 | 生成图像高度,需同时传 width 和 height 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合 | - | 宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间 |
推荐宽高组合
| 分辨率 | 宽度 | 高度 | 宽高比 |
|---|---|---|---|
| 标清 1K | 1328 | 1328 | 1:1 |
| 标清 1K | 1472 | 1104 | 4:3 |
| 标清 1K | 1584 | 1056 | 3:2 |
| 标清 1K | 1664 | 936 | 16:9 |
| 标清 1K | 2016 | 864 | 21:9 |
| 高清 2K | 2048 | 2048 | 1:1 |
| 高清 2K | 2304 | 1728 | 4:3 |
| 高清 2K | 2496 | 1664 | 3:2 |
| 高清 2K | 2560 | 1440 | 16:9 |
| 高清 2K | 3024 | 1296 | 21:9 |
请求示例
文生图示例:
json
{
"model": "即梦文生图 3.1",
"input": {
"prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
},
"extra_body": {
"use_pre_llm": true,
"seed": -1,
"width": 1328,
"height": 1328
}
}即梦文生图 3.0 模型
Input 参数
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
prompt | string | 是 | 用于生成图像的提示词,中英文均可输入。建议长度<=120字符,最长不超过800字符,prompt过长有概率出图异常或不生效 | 非空字符串,最长不超过 800 字符 |
ExtraBody 参数
| 参数名 | 类型 | 必填 | 说明 | 默认值 | 取值范围/格式 |
|---|---|---|---|---|---|
use_pre_llm | bool | 否 | 开启文本扩写,会针对输入prompt进行扩写优化,如果输入prompt较短建议开启,如果输入prompt较长建议关闭 | true | 布尔值 |
seed | int | 否 | 随机种子,作为确定扩散初始状态的基础,默认-1(随机)。若随机种子为相同正整数且其他参数均一致,则生成图片极大概率效果一致 | -1 | 整数,-1 表示随机 |
width | int | 否 | 生成图像宽度,需同时传 width 和 height 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合 | - | 宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间 |
height | int | 否 | 生成图像高度,需同时传 width 和 height 才会生效。系统默认生成 1328 * 1328 的图像。宽高比在 1:3 到 3:1 之间,宽高乘积在 [512*512, 2048*2048] 之间。详见下方推荐宽高组合 | - | 宽高乘积在 [512*512, 2048*2048],且宽高比在 [1/3, 3] 之间 |
推荐宽高组合
| 分辨率 | 宽度 | 高度 | 宽高比 |
|---|---|---|---|
| 标清 1K | 1328 | 1328 | 1:1 |
| 标清 1K | 1472 | 1104 | 4:3 |
| 标清 1K | 1584 | 1056 | 3:2 |
| 标清 1K | 1664 | 936 | 16:9 |
| 标清 1K | 2016 | 864 | 21:9 |
| 高清 2K | 2048 | 2048 | 1:1 |
| 高清 2K | 2304 | 1728 | 4:3 |
| 高清 2K | 2496 | 1664 | 3:2 |
| 高清 2K | 2560 | 1440 | 16:9 |
| 高清 2K | 3024 | 1296 | 21:9 |
请求示例
文生图示例:
json
{
"model": "即梦文生图 3.0",
"input": {
"prompt": "一只可爱的猫咪在花园里玩耍,阳光明媚"
},
"extra_body": {
"use_pre_llm": true,
"seed": -1,
"width": 1328,
"height": 1328
}
}响应示例
所有模型都返回标准化的响应格式,示例如下:
json
{
"created": 1736123456,
"data": [
{
"url": "https://example.com/generated-image-1.jpg",
"b64_json": "iVBORw0KGgoAAAANSUhEUgAA..." // 可选字段
},
{
"url": "https://example.com/generated-image-2.jpg"
}
],
"usage": {
"total_tokens": 0,
"input_tokens": 0,
"output_tokens": 0,
"input_tokens_details": {
"text_tokens": 0,
"image_tokens": 0
},
"image_count": 2
},
"provider": "火山方舟",
"model": "即梦图片生成 4.0",
"origin_data": { ... } // 可选字段
}说明:
data[].b64_json字段:仅在extra_body.provider.enable_image_base64设置为true时返回。默认值为false,此时响应中不包含b64_json字段origin_data字段:包含供应商 API 的完整原始响应数据。可通过设置extra_body.provider.enable_image_origin_data参数控制是否返回此字段(默认值为false,不会返回)。如需查看不同模型的原始响应格式,请在请求中设置extra_body.provider.enable_image_origin_data: true,然后在响应的origin_data字段中查看供应商返回的原始数据
响应参数说明
成功响应
| 参数名 | 类型 | 必填 | 说明 | 取值范围/格式 |
|---|---|---|---|---|
created | integer | 是 | 响应创建时间,Unix 时间戳(秒) | 整数,Unix 时间戳(秒) |
data | array | 是 | 生成的图像数据数组 | 数组对象,每个元素包含图像信息 |
data[].url | string | 是 | 生成的图像 URL | URL 字符串 |
data[].b64_json | string | 否 | 图像的 Base64 编码数据。控制参数:仅在请求参数 extra_body.provider.enable_image_base64 设置为 true 时返回此字段。默认值为 false,此时不返回此字段 | Base64 编码的字符串 |
usage | object | 是 | 使用情况统计 | 对象类型 |
usage.total_tokens | integer | 是 | 总 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens | integer | 是 | 输入 token 数 | 整数,图像生成场景通常为 0 |
usage.output_tokens | integer | 是 | 输出 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens_details | object | 是 | 输入 token 详情 | 对象类型 |
usage.input_tokens_details.text_tokens | integer | 是 | 文本 token 数 | 整数,图像生成场景通常为 0 |
usage.input_tokens_details.image_tokens | integer | 是 | 图像 token 数 | 整数,图像生成场景通常为 0 |
usage.image_count | integer | 是 | 生成的图像数量 | 整数,大于等于 1 |
provider | string | 是 | 供应商名称 | 字符串,如"火山方舟" |
model | string | 是 | 模型名称 | 字符串,如"Doubao-Seedream-4.0" |
origin_data | object | 否 | 供应商的原始响应数据。控制参数:仅在请求参数 extra_body.provider.enable_image_origin_data 设置为 true 时返回此字段。默认值为 false,此时不返回此字段 | 对象类型,包含供应商 API 的完整原始响应 |
错误响应
当 API 调用失败时,会返回供应商的原始错误信息。
错误响应格式:
- 如果响应是 JSON 格式,返回完整的错误 JSON 对象
- 如果响应是文本格式,返回错误文本
- 如果无法解析,返回
HTTP {status_code}
错误响应示例:
json
{
"error": {
"message": "Invalid parameter",
"code": "invalid_param"
}
}注意事项
模型参数限制:不同模型支持的参数不同。对于不在白名单中的参数,系统会记录警告日志,但不会过滤,仍会传递给供应商 API 进行最终判断
参数透传:所有参数(包括
size、width、height、scale等)都会透传给供应商 API,由供应商进行校验和判断面积和宽高参数使用规则:
- 文生图场景:面积(
size)和宽高(width/height)需要 2 选 1 传入,都不传则默认面积取2048*2048,即生成 2K 分辨率图像且模型智能判断宽高比 - 面积和宽高同时输入时,优先使用宽高
- 只传面积,模型会根据用户
prompt意图智能判断生图宽高比 - 图生图场景:结合用户
prompt意图、参考图尺寸,由模型智能判断生图宽高比
- 文生图场景:面积(
输入输出限制:
- 输入图要求:
- 图片格式:仅支持 JPEG、PNG 格式,建议使用 JPEG 格式
- 图片文件大小:最大 15 MB,支持最多输入 10 张图(通过
image、image2、image3...image10等参数分别传入,每张图片需单独传入对应参数) - 图片分辨率:最大 4096*4096
- 输入图宽高比:(宽/高)范围:[1/3, 3]
- 输出图说明:
- 输出图宽高规则:参考
width、height参数描述 - 输出图数量:输出图会以列表形式返回(
data.binary_data_base64数组),最大输出图数量 = 15 - 输入图数量 - 输出图格式:图片以 Base64 编码格式返回在
data.binary_data_base64数组中,同时提供data.binary_listURI 列表 - 延迟说明:输出图片的分辨率越大、输出图片数量越多、输入图片数量越多,延迟增加越明显
- 计费说明:1 次调用可能输出多张图片,根据输出图片张数进行计费,默认根据
prompt理解意图判断输出图片数量。成本信息在data.comfyui_cost字段中返回
- 输出图宽高规则:参考
- 输入图要求:
输入图片数量建议:
- 输入图片建议控制在 6 张图片以内,图片过多,参考效果会降低
组图生成建议:
- 如需稳定的组图输出效果,建议
prompt控制组图数量在 9 张及以内 - 生成组图时,建议
prompt明确指明图片分辨率或直接传参具体宽高值,避免模型生成组图分辨率不一致导致接口报错
- 如需稳定的组图输出效果,建议
未知参数处理:未知参数会被记录警告日志,但仍会传递给供应商 API,由供应商判断是否返回错误
供应商调度参数:关于
extra_body.provider参数的完整说明和使用示例,请参考供应商调度参数说明