指南
推理
grok-4
、grok-3-mini
和 grok-3-mini-fast
是仅支持推理的模型。
presencePenalty
、frequencyPenalty
和 stop
参数不支持推理模型。在请求中添加它们将导致错误。
主要功能
- 先思考再回应:在给出答案之前,逐步思考问题。
- 数学和定量能力强:擅长数字挑战和逻辑谜题。
- 推理轨迹:模型的思考过程可通过响应完成对象中的
reasoning_content
字段获取(见以下示例)。
您可以通过聊天完成响应的 message.reasoning_content
访问模型的原始思维轨迹。
grok-4
不返回 reasoning_content
控制模型思考的努力程度
reasoning_effort
不受 grok-4
支持。指定 reasoning_effort
参数将收到错误响应。
reasoning_effort
参数控制模型在响应前思考的时间。它必须设置为以下值之一:
low
:最小思考时间,使用较少令牌以实现快速响应。high
:最大思考时间,利用更多令牌处理复杂问题。
选择合适的级别取决于您的任务:对于应快速完成的简单查询,使用 low
;对于响应延迟不那么重要的困难问题,使用 high
。
使用示例
这是一个使用 grok-4
将 101 乘以 3 的简单示例。请注意,我们可以同时访问推理内容和最终响应。
示例输出
关于消费的说明
当您使用推理模型时,推理令牌也会添加到您的最终消费金额中。当您使用更高的 reasoning_effort
设置时,推理令牌的消费量可能会增加。