Spaces:

yym68686
/

uni-api

Sleeping

App Files Files Community

yym68686 commited on Oct 22, 2024

Commit

73319d1

1 Parent(s): bf80b6a

🐛 Bug: Fix the bug where Gemini cannot use non-streaming output.

Browse files

Files changed (3) hide show

main.py +4 -3
response.py +69 -4
test/test_json.py +26 -0

main.py CHANGED Viewed

@@ -531,7 +531,7 @@ async def process_request(request: Union[RequestModel, ImageGenerationRequest, A
     if provider.get("engine"):
         engine = provider["engine"]
-    logger.info(f"provider: {provider['provider']:<10} model: {request.model:<10} engine: {engine}")
     url, headers, payload = await get_payload(request, engine, provider)
     if is_debug:
@@ -542,16 +542,17 @@ async def process_request(request: Union[RequestModel, ImageGenerationRequest, A
             logger.info(json.dumps(payload, indent=4, ensure_ascii=False))
     current_info = request_info.get()
     try:
         if request.stream:
-            model = model_dict[request.model]
             generator = fetch_response_stream(app.state.client, url, headers, payload, engine, model)
             wrapped_generator, first_response_time = await error_handling_wrapper(generator)
             response = StarletteStreamingResponse(wrapped_generator, media_type="text/event-stream")
         else:
-            generator = fetch_response(app.state.client, url, headers, payload)
             wrapped_generator, first_response_time = await error_handling_wrapper(generator)
             first_element = await anext(wrapped_generator)
             first_element = first_element.lstrip("data: ")
             first_element = json.loads(first_element)
             response = StarletteStreamingResponse(iter([json.dumps(first_element)]), media_type="application/json")
             # response = JSONResponse(first_element)

     if provider.get("engine"):
         engine = provider["engine"]
+    logger.info(f"provider: {provider['provider']:<11} model: {request.model:<22} engine: {engine}")
     url, headers, payload = await get_payload(request, engine, provider)
     if is_debug:
             logger.info(json.dumps(payload, indent=4, ensure_ascii=False))
     current_info = request_info.get()
     try:
+        model = model_dict[request.model]
         if request.stream:
             generator = fetch_response_stream(app.state.client, url, headers, payload, engine, model)
             wrapped_generator, first_response_time = await error_handling_wrapper(generator)
             response = StarletteStreamingResponse(wrapped_generator, media_type="text/event-stream")
         else:
+            generator = fetch_response(app.state.client, url, headers, payload, engine, model)
             wrapped_generator, first_response_time = await error_handling_wrapper(generator)
             first_element = await anext(wrapped_generator)
             first_element = first_element.lstrip("data: ")
+            print("first_element", first_element)
             first_element = json.loads(first_element)
             response = StarletteStreamingResponse(iter([json.dumps(first_element)]), media_type="application/json")
             # response = JSONResponse(first_element)

response.py CHANGED Viewed

@@ -4,6 +4,8 @@ from datetime import datetime
 from log_config import logger
 # end_of_line = "\n\r\n"
 # end_of_line = "\r\n"
 # end_of_line = "\n\r"
@@ -17,7 +19,6 @@ async def generate_sse_response(timestamp, model, content=None, tools_id=None, f
         "object": "chat.completion.chunk",
         "created": timestamp,
         "model": model,
-        "system_fingerprint": "fp_d576307f90",
         "choices": [
             {
                 "index": 0,
@@ -26,7 +27,8 @@ async def generate_sse_response(timestamp, model, content=None, tools_id=None, f
                 "finish_reason": None
             }
         ],
-        "usage": None
     }
     if function_call_content:
         sample_data["choices"][0]["delta"] = {"tool_calls":[{"index":0,"function":{"arguments": function_call_content}}]}
@@ -46,6 +48,34 @@ async def generate_sse_response(timestamp, model, content=None, tools_id=None, f
     return sse_response
 async def check_response(response, error_log):
     if response and response.status_code != 200:
         error_message = await response.aread()
@@ -274,7 +304,7 @@ async def fetch_claude_response_stream(client, url, headers, payload, model):
                         yield sse_string
         yield "data: [DONE]" + end_of_line
-async def fetch_response(client, url, headers, payload):
     response = None
     if payload.get("file"):
         file = payload.pop("file")
@@ -285,7 +315,42 @@ async def fetch_response(client, url, headers, payload):
     if error_message:
         yield error_message
         return
-    yield response.json()
 async def fetch_response_stream(client, url, headers, payload, engine, model):
     try:

 from log_config import logger
+from utils import safe_get
 # end_of_line = "\n\r\n"
 # end_of_line = "\r\n"
 # end_of_line = "\n\r"
         "object": "chat.completion.chunk",
         "created": timestamp,
         "model": model,
         "choices": [
             {
                 "index": 0,
                 "finish_reason": None
             }
         ],
+        "usage": None,
+        "system_fingerprint": "fp_d576307f90",
     }
     if function_call_content:
         sample_data["choices"][0]["delta"] = {"tool_calls":[{"index":0,"function":{"arguments": function_call_content}}]}
     return sse_response
+async def generate_no_stream_response(timestamp, model, content=None, tools_id=None, function_call_name=None, function_call_content=None, role=None, total_tokens=0, prompt_tokens=0, completion_tokens=0):
+    sample_data = {
+        "id": "chatcmpl-ALGS9hpJBb8xVAe62DRriY2SpoT4L",
+        "object": "chat.completion",
+        "created": timestamp,
+        "model": model,
+        "choices": [
+            {
+                "index": 0,
+                "message": {
+                    "role": role,
+                    "content": content,
+                    "refusal": None
+                },
+                "logprobs": None,
+                "finish_reason": "stop"
+            }
+        ],
+        "usage": None,
+        "system_fingerprint": "fp_a7d06e42a7"
+    }
+    if total_tokens:
+        total_tokens = prompt_tokens + completion_tokens
+        sample_data["usage"] = {"prompt_tokens": prompt_tokens, "completion_tokens": completion_tokens, "total_tokens": total_tokens}
+    json_data = json.dumps(sample_data, ensure_ascii=False)
+    return json_data
 async def check_response(response, error_log):
     if response and response.status_code != 200:
         error_message = await response.aread()
                         yield sse_string
         yield "data: [DONE]" + end_of_line
+async def fetch_response(client, url, headers, payload, engine, model):
     response = None
     if payload.get("file"):
         file = payload.pop("file")
     if error_message:
         yield error_message
         return
+    response_json = response.json()
+    if engine == "gemini" or engine == "vertex-gemini":
+        if isinstance(response_json, str):
+            import ast
+            parsed_data = ast.literal_eval(str(response_json))
+        elif isinstance(response_json, list):
+            parsed_data = response_json
+        else:
+            logger.error(f"error fetch_response: Unknown response_json type: {type(response_json)}")
+            parsed_data = response_json
+        content = ""
+        for item in parsed_data:
+            chunk = safe_get(item, "candidates", 0, "content", "parts", 0, "text")
+            # logger.info(f"chunk: {repr(chunk)}")
+            if chunk:
+                content += chunk
+        usage_metadata = safe_get(parsed_data, -1, "usageMetadata")
+        prompt_tokens = usage_metadata.get("promptTokenCount", 0)
+        candidates_tokens = usage_metadata.get("candidatesTokenCount", 0)
+        total_tokens = usage_metadata.get("totalTokenCount", 0)
+        role = safe_get(parsed_data, -1, "candidates", 0, "content", "role")
+        if role == "model":
+            role = "assistant"
+        else:
+            logger.error(f"Unknown role: {role}")
+            role = "assistant"
+        timestamp = int(datetime.timestamp(datetime.now()))
+        yield await generate_no_stream_response(timestamp, model, content=content, tools_id=None, function_call_name=None, function_call_content=None, role=role, total_tokens=total_tokens, prompt_tokens=prompt_tokens, completion_tokens=candidates_tokens)
+    else:
+        yield response_json
 async def fetch_response_stream(client, url, headers, payload, engine, model):
     try:

test/test_json.py ADDED Viewed

	@@ -0,0 +1,26 @@

+import ast
+import json
+import os
+import sys
+sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
+from utils import safe_get
+# 读取文件内容
+with open('test/states.json', 'r', encoding='utf-8') as file:
+    content = file.read()
+# 使用ast.literal_eval解析非标准JSON
+parsed_data = ast.literal_eval(content)
+for item in parsed_data:
+    print(safe_get(item, "candidates", 0, "content", "parts", 0, "text"))
+    print(safe_get(item, "candidates", 0, "content", "role"))
+# 将解析后的数据转换为标准JSON
+standard_json = json.dumps(parsed_data, ensure_ascii=False, indent=2)
+# 将标准JSON写入新文件
+with open('test/standard_states.json', 'w', encoding='utf-8') as file:
+    file.write(standard_json)
+print("转换完成，标准JSON已保存到 'test/standard_states.json'")