推理设置

本页面所有说明都应该在OpenAI SDK中使用。在Claude / Gemini原生 API 无效。

Claude

Claude 默认 tokens

如果未指定max_tokens，我们会默认赋值Claude允许的最大 tokens 传入。例如claude-3-7的最大 tokens 为128000。

Claude 3.7 模型开启 thinking

在请求时，将模型名称后面添加 #thinking 可以开启 thinking 模式。我们会自动将 max_tokens 的 80%作为budget_tokens传入给 Claude。

例如：

bash

curl -X POST https://api.uniapi.io/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-proj-1234567890" \
  -d '{
    "model": "claude-3-7-sonnet-20250219#thinking",
    "messages": [{"role": "user", "content": "你好"}]
  }'

自定义 Claude 3-7 模型推理参数

您可以使用以下参数控制请求中的推理标记 reasoning：

json

{
  "model": "claude-3-7-sonnet-2025021",
  "messages": [],
  "reasoning": {
    "effort": "high", // 强度参数 (可选)
    "max_tokens": 2000 // 推理最大tokens，目前特指budget_tokens (可选)
  }
}

开启推理

当您直接传入"reasoning": {}时，效果和claude-3-7-sonnet-20250219#thinking一致，不需要再更改模型名称。

强度参数

effort 参数可以设置为 high、medium 或 low。

high：将分配80%的max_tokens作为budget_tokens。
medium：将分配50%的max_tokens作为budget_tokens。
low：将分配20%的max_tokens作为budget_tokens。

推理最大 tokens

reasoning.max_tokens 参数可以设置为具体的数值，表示推理最大 tokens，目前特指 budget_tokens。

WARNING

reasoning.max_tokens 参数需要大于max_tokens,且不能低于1024。

优先级

如果同时在reasoning传入effort和max_tokens，优先级如下：

max_tokens > effort

Gemini

自定义 Gemini 模型推理参数

Gemini的推理参数和Claude不一样，在gemini 2.5中是默认开启推理的，如果需要关闭则需要传入reasoning参数。

json

{
  "model": "gemini-2.5-flash-preview-04-17",
  "messages": [],
  "reasoning": {
    "max_tokens": 2000 // 推理最大tokens，目前特指budget_tokens (可选)
  }
}

WARNING

reasoning.max_tokens 为 0 时关闭推理。或者只传入"reasoning": {}时，默认关闭推理。

推理设置 ​

Claude ​

Claude 默认 tokens ​

Claude 3.7 模型开启 thinking ​

自定义 Claude 3-7 模型推理参数 ​

开启推理 ​

强度参数 ​

推理最大 tokens ​

优先级 ​

Gemini ​

自定义 Gemini 模型推理参数 ​