指南
图像生成
一些模型可以提供图像生成功能。您可以提供一些您希望生成的图像的描述,让模型在输出中生成一张或多张图片。
如果您习惯于与聊天/图像理解模型交互,图像生成与它们略有不同。您只需在请求中发送一个提示文本,而不是一个包含系统/用户/助手角色的消息列表。当您发送图像生成提示时,您的提示将由聊天模型修改,然后发送到图像生成模型。
参数
n
:要生成的图像数量(1-10,默认为 1)response_format
:"url"
或"b64_json"
。如果指定"url"
,响应将在data[index].url
中返回图像的 URL;如果指定 "b64_json",响应将在data[index].b64_json
中返回 base64 编码格式的图像。
注意:目前 xAI API 不支持
quality
、size
或style
。
生成图像
图像生成功能在不同于聊天和图像理解模型的端点 https://api.x.ai/v1/images/generations
提供,聊天和图像理解模型共享 https://api.x.ai/v1/chat/completions
。该端点与 OpenAI SDK 兼容(但不与 Anthropic SDK 兼容),因此您可以继续使用相同的 base_url
:https://api.x.ai/v1
。
您可以在请求正文中设置 "model": "grok-2-image"
来使用该模型。生成的图像将采用 jpg
格式。
Python 和 JavaScript 示例将打印出 xAI 管理存储中的图片 URL。
这是根据上述提示生成的示例图像

Base 64 JSON 输出
您可以通过指定 response_format
参数为 "b64_json"
,而不是默认获取图像 URL,来选择获取 base64 编码的图像。
您将在响应图像对象中获得一个 b64_json
字段,而不是 url
。
生成多张图像
您可以通过在请求正文中添加参数 n
,在一个请求中生成最多 10 张图像。例如,要生成四张图像
修订后的提示
如果您检查响应对象,您会看到类似这样的内容
在将提示发送到图像生成模型之前,该提示将由聊天模型进行修订。聊天模型修订后的提示将由图像生成模型用于创建图像,并作为 revised_prompt
返回给用户。
要通过 SDK 查看修订后的提示
例如
输入/输出 | 示例 |
---|---|
提示(在请求正文中) | 树上的猫 |
修订后的提示(在响应正文中) | 白天,郊区后院,一只绿眼睛的灰猫栖息在多叶树的粗壮树枝上,3D 渲染图。猫的毛发被微风轻轻吹乱,它正直接看向观察者。背景是晴朗的天空,有几朵云和一些树木,营造出自然而宁静的环境。场景聚焦于猫,没有分散注意力的前景元素,确保猫仍然是图像的中心主题。 |