grok4

2025-07-10 08:18:20 +02:00
parent 5249e1c904
commit 08400db220
3 changed files with 61 additions and 27 deletions
@@ -125,6 +125,8 @@ export const validateContextSize: RequestPreprocessor = async (req) => {
    modelMax = 100000;
  } else if (model.match(/^deepseek/)) {
    modelMax = 64000;
+  } else if (model.match(/^grok-4/)) {
+    modelMax = 256000;
  } else if (model.match(/^grok/)) {
    modelMax = 128000;
  } else if (model.match(/command-a-03-202[0-9]/)) {
@@ -6,7 +6,7 @@ import { addKey, finalizeBody } from "./middleware/request";
 import { ProxyResHandlerWithBody } from "./middleware/response";
 import axios from "axios";
 import { XaiKey, keyPool } from "../shared/key-management";
-import { isGrokVisionModel, isGrokImageGenModel, isGrokReasoningModel } from "../shared/api-schemas/xai";
+import { isGrokVisionModel, isGrokImageGenModel, isGrokReasoningModel, isGrokReasoningEffortModel, isGrokReasoningContentModel } from "../shared/api-schemas/xai";

 let modelsCache: any = null;
 let modelsCacheTime = 0;
@@ -77,6 +77,9 @@ const xaiResponseHandler: ProxyResHandlerWithBody = async (
  // Check if this is a chat completion response with choices
  else if (body.choices && Array.isArray(body.choices) && body.choices.length > 0) {
    // Make sure each choice's message is preserved, especially reasoning_content
+    // Only grok-3-mini models return reasoning_content
+    const model = req.body.model;
+    if (isGrokReasoningContentModel(model)) {
      body.choices.forEach(choice => {
        if (choice.message && choice.message.reasoning_content) {
          req.log.debug(
@@ -86,6 +89,7 @@ const xaiResponseHandler: ProxyResHandlerWithBody = async (
        }
      });
    }
+  }

  res.status(200).json({ ...newBody, proxy: body.proxy });
 };
@@ -236,24 +240,28 @@ function redirectImageRequests(req: Request) {
 function removeUnsupportedParameters(req: Request) {
  const model = req.body.model;
  
-  // Check if this is a grok-3-mini variant that supports reasoning
-  const isGrok3MiniReasoning = isGrokReasoningModel(model);
+  // Check if this is a reasoning model (grok-3-mini or grok-4-0709)
+  const isReasoningModel = isGrokReasoningModel(model);
+  const isReasoningEffortModel = isGrokReasoningEffortModel(model);
  
-  if (isGrok3MiniReasoning) {
-    // List of parameters not supported by Grok-3-mini models
+  if (isReasoningModel) {
+    // List of parameters not supported by reasoning models
    const unsupportedParams = [
      'presence_penalty',
-      'frequency_penalty'
+      'frequency_penalty',
+      'stop'  // stop parameter is not supported by reasoning models
    ];
    
    for (const param of unsupportedParams) {
      if (req.body[param] !== undefined) {
-        req.log.info(`Removing unsupported parameter for Grok-3-mini model: ${param}`);
+        req.log.info(`Removing unsupported parameter for reasoning model ${model}: ${param}`);
        delete req.body[param];
      }
    }
    
-    // Support reasoning_effort parameter
+    // Handle reasoning_effort parameter - only supported by grok-3-mini
+    if (isReasoningEffortModel) {
+      // This is grok-3-mini, handle reasoning_effort
      if (req.body.reasoning_effort) {
        // If reasoning_effort is already present in the request, validate it
        if (!['low', 'medium', 'high'].includes(req.body.reasoning_effort)) {
@@ -265,6 +273,13 @@ function removeUnsupportedParameters(req: Request) {
        req.body.reasoning_effort = 'low';
        req.log.debug(`Setting default reasoning_effort=low for Grok-3-mini model`);
      }
+    } else {
+      // This is grok-4-0709 or other reasoning model that doesn't support reasoning_effort
+      if (req.body.reasoning_effort !== undefined) {
+        req.log.info(`Removing unsupported reasoning_effort parameter for model ${model}`);
+        delete req.body.reasoning_effort;
+      }
+    }
  }
  
  // Special handling for vision models
@@ -47,9 +47,26 @@ export function isGrokImageGenModel(model: string): boolean {

 // Helper function to check if a model supports reasoning
 export function isGrokReasoningModel(model: string): boolean {
-  // Currently, only grok-3-mini variants support reasoning
-  // This is more restrictive as reasoning is a specific capability
-  return model.toLowerCase().includes("-mini") && model.toLowerCase().includes("grok-3");
+  // grok-3-mini variants and grok-4-0709 support reasoning
+  const modelLower = model.toLowerCase();
+  return (modelLower.includes("-mini") && modelLower.includes("grok-3")) || 
+         modelLower.includes("grok-4");
+}
+
+// Helper function to check if a model supports reasoning_effort parameter
+export function isGrokReasoningEffortModel(model: string): boolean {
+  // Only grok-3-mini variants support reasoning_effort parameter
+  // grok-4-0709 does NOT support reasoning_effort
+  const modelLower = model.toLowerCase();
+  return modelLower.includes("-mini") && modelLower.includes("grok-3");
+}
+
+// Helper function to check if a model returns reasoning_content
+export function isGrokReasoningContentModel(model: string): boolean {
+  // Only grok-3-mini variants return reasoning_content
+  // grok-4-0709 does NOT return reasoning_content
+  const modelLower = model.toLowerCase();
+  return modelLower.includes("-mini") && modelLower.includes("grok-3");
 }

 // Main Grok chat message schema