sone-latest

Running

App Files Files Community

yangtb24 commited on 28 days ago

Commit

bf0d834

•

1 Parent(s): d91f35e

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -2

app.py CHANGED Viewed

@@ -358,6 +358,7 @@ def handsome_chat_completions():
                 first_token_time = first_chunk_time - start_time if first_chunk_time else 0
                 total_time = end_time - start_time
                 prompt_tokens = 0
                 completion_tokens = 0
                 response_content = ""
@@ -369,6 +370,7 @@ def handsome_chat_completions():
                         try:
                             response_json = json.loads(line)
                             if "usage" in response_json and "completion_tokens" in response_json["usage"]:
                                 completion_tokens = response_json["usage"]["completion_tokens"]
@@ -381,6 +383,7 @@ def handsome_chat_completions():
                         except (KeyError, ValueError, IndexError) as e:
                             logging.error(f"解析流式响应单行 JSON 失败: {e}, 行内容: {line}")
                 user_content = ""
                 messages = data.get("messages", [])
                 for message in messages:
@@ -388,16 +391,19 @@ def handsome_chat_completions():
                         user_content += message["content"] + " "
                 user_content = user_content.strip()
                 logging.info(
-                    f"使用的key: {api_key}, 提示token: {prompt_tokens}, 输出token: {completion_tokens}, 首字用时: 0, 总共用时: {total_time:.4f}秒, 使用的模型: {model_name}, 用户的内容: {user_content.replace(chr(10), r'\\n').replace(chr(13), r'\\n')}, 输出的内容: {response_content.replace(chr(10), r'\\n').replace(chr(13), r'\\n')}"
                 )
             return Response(stream_with_context(generate()), content_type=response.headers['Content-Type'])
         else:
             response.raise_for_status()
             end_time = time.time()
             response_json = response.json()
             total_time = end_time - start_time
             try:
                 prompt_tokens = response_json["usage"]["prompt_tokens"]
                 completion_tokens = response_json["usage"]["completion_tokens"]
@@ -408,6 +414,7 @@ def handsome_chat_completions():
                 completion_tokens = 0
                 response_content = ""
             user_content = ""
             messages = data.get("messages", [])
             for message in messages:
@@ -415,8 +422,9 @@ def handsome_chat_completions():
                     user_content += message["content"] + " "
             user_content = user_content.strip()
             logging.info(
-                f"使用的key: {api_key}, 提示token: {prompt_tokens}, 输出token: {completion_tokens}, 首字用时: 0, 总共用时: {total_time:.4f}秒, 使用的模型: {model_name}, 用户的内容: {user_content.replace(chr(10), r'\\n').replace(chr(13), r'\\n')}, 输出的内容: {response_content.replace(chr(10), r'\\n').replace(chr(13), r'\\n')}"
             )
             return jsonify(response_json)

                 first_token_time = first_chunk_time - start_time if first_chunk_time else 0
                 total_time = end_time - start_time
+                # 处理流式响应，逐行解析 JSON
                 prompt_tokens = 0
                 completion_tokens = 0
                 response_content = ""
                         try:
                             response_json = json.loads(line)
+                            # 提取信息，这里只累加 completion_tokens 和 content
                             if "usage" in response_json and "completion_tokens" in response_json["usage"]:
                                 completion_tokens = response_json["usage"]["completion_tokens"]
                         except (KeyError, ValueError, IndexError) as e:
                             logging.error(f"解析流式响应单行 JSON 失败: {e}, 行内容: {line}")
+                # 提取用户输入的内容，忽略非文本内容
                 user_content = ""
                 messages = data.get("messages", [])
                 for message in messages:
                         user_content += message["content"] + " "
                 user_content = user_content.strip()
+                # 记录日志，将换行符替换为 \n
                 logging.info(
+                    f"使用的key: {api_key}, 提示token: {prompt_tokens}, 输出token: {completion_tokens}, 首字用时: {first_token_time:.4f}秒, 总共用时: {total_time:.4f}秒, 使用的模型: {model_name}, 用户的内容: {user_content.replace(chr(10), '\\n').replace(chr(13), '\\n')}, 输出的内容: {response_content.replace(chr(10), '\\n').replace(chr(13), '\\n')}"
                 )
             return Response(stream_with_context(generate()), content_type=response.headers['Content-Type'])
         else:
+            # 非流式响应处理... (保持原样)
             response.raise_for_status()
             end_time = time.time()
             response_json = response.json()
             total_time = end_time - start_time
+            # 从响应中提取信息
             try:
                 prompt_tokens = response_json["usage"]["prompt_tokens"]
                 completion_tokens = response_json["usage"]["completion_tokens"]
                 completion_tokens = 0
                 response_content = ""
+            # 提取用户输入的内容，忽略非文本内容
             user_content = ""
             messages = data.get("messages", [])
             for message in messages:
                     user_content += message["content"] + " "
             user_content = user_content.strip()
+            # 记录日志，将换行符替换为 \n
             logging.info(
+                f"使用的key: {api_key}, 提示token: {prompt_tokens}, 输出token: {completion_tokens}, 首字用时: 0, 总共用时: {total_time:.4f}秒, 使用的模型: {model_name}, 用户的内容: {user_content.replace(chr(10), '\\n').replace(chr(13), '\\n')}, 输出的内容: {response_content.replace(chr(10), '\\n').replace(chr(13), '\\n')}"
             )
             return jsonify(response_json)