指南

图像生成

一些模型可以提供图像生成功能。您可以提供一些您希望生成的图像的描述,让模型在输出中生成一张或多张图片。

如果您习惯于与聊天/图像理解模型交互,图像生成与它们略有不同。您只需在请求中发送一个提示文本,而不是一个包含系统/用户/助手角色的消息列表。当您发送图像生成提示时,您的提示将由聊天模型修改,然后发送到图像生成模型。

参数

  • n:要生成的图像数量(1-10,默认为 1)
  • response_format"url""b64_json"。如果指定 "url",响应将在 data[index].url 中返回图像的 URL;如果指定 "b64_json",响应将在 data[index].b64_json 中返回 base64 编码格式的图像。

注意:目前 xAI API 不支持 qualitysizestyle


生成图像

图像生成功能在不同于聊天和图像理解模型的端点 https://api.x.ai/v1/images/generations 提供,聊天和图像理解模型共享 https://api.x.ai/v1/chat/completions。该端点与 OpenAI SDK 兼容(但不与 Anthropic SDK 兼容),因此您可以继续使用相同的 base_urlhttps://api.x.ai/v1

您可以在请求正文中设置 "model": "grok-2-image" 来使用该模型。生成的图像将采用 jpg 格式。

Python 和 JavaScript 示例将打印出 xAI 管理存储中的图片 URL。

这是根据上述提示生成的示例图像

A cat in a tree

Base 64 JSON 输出

您可以通过指定 response_format 参数为 "b64_json",而不是默认获取图像 URL,来选择获取 base64 编码的图像。

您将在响应图像对象中获得一个 b64_json 字段,而不是 url

生成多张图像

您可以通过在请求正文中添加参数 n,在一个请求中生成最多 10 张图像。例如,要生成四张图像


修订后的提示

如果您检查响应对象,您会看到类似这样的内容

在将提示发送到图像生成模型之前,该提示将由聊天模型进行修订。聊天模型修订后的提示将由图像生成模型用于创建图像,并作为 revised_prompt 返回给用户。

要通过 SDK 查看修订后的提示

例如

输入/输出示例
提示(在请求正文中)树上的猫
修订后的提示(在响应正文中)白天,郊区后院,一只绿眼睛的灰猫栖息在多叶树的粗壮树枝上,3D 渲染图。猫的毛发被微风轻轻吹乱,它正直接看向观察者。背景是晴朗的天空,有几朵云和一些树木,营造出自然而宁静的环境。场景聚焦于猫,没有分散注意力的前景元素,确保猫仍然是图像的中心主题。