gemini-rproxy

Running

App Files Files Community

Moonfanz commited on Dec 17, 2024

Commit

7e8a8d2

verified ·

1 Parent(s): 3ef6335

Upload 4 files

Browse files

Files changed (4) hide show

Dockerfile +10 -0
app.py +221 -0
func.py +92 -0
requirements.txt +7 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,10 @@

+FROM python:3.9-slim
+WORKDIR /app
+COPY requirements.txt .
+RUN pip install --no-cache-dir -r requirements.txt
+COPY . .
+CMD ["python", "app.py"]

app.py ADDED Viewed

	@@ -0,0 +1,221 @@

+from flask import Flask, request, jsonify, Response, stream_with_context
+import google.generativeai as genai
+import json
+from datetime import datetime
+import os
+import logging
+import func
+os.environ['TZ'] = 'Asia/Shanghai'
+app = Flask(__name__)
+app.secret_key = os.urandom(24)
+PASSWORD = os.environ['password']
+formatter = logging.Formatter('%(message)s')
+logger = logging.getLogger(__name__)
+logger.setLevel(logging.INFO)
+handler = logging.StreamHandler()
+handler.setFormatter(formatter)
+logger.addHandler(handler)
+safety_settings = [
+    {
+        "category": "HARM_CATEGORY_HARASSMENT",
+        "threshold": "BLOCK_NONE"
+    },
+    {
+        "category": "HARM_CATEGORY_HATE_SPEECH",
+        "threshold": "BLOCK_NONE"
+    },
+    {
+        "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
+        "threshold": "BLOCK_NONE"
+    },
+    {
+        "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
+        "threshold": "BLOCK_NONE"
+    },
+]
+class APIKeyManager:
+    def __init__(self):
+        self.api_keys = os.environ.get('GEMINI_API_KEY').split(',')
+        self.current_index = 0
+    def get_available_key(self):
+        if self.current_index >= len(self.api_keys):
+            self.current_index = 0
+        current_key = self.api_keys[self.current_index]
+        self.current_index += 1
+        return current_key
+key_manager = APIKeyManager()
+current_api_key = key_manager.get_available_key()
+logger.info(f"Current API key: {current_api_key}")
+GEMINI_MODELS = [
+    {"id": "gemini-pro"},
+    {"id": "gemini-pro-vision"},
+    {"id": "gemini-1.0-pro"},
+    {"id": "gemini-1.0-pro-vision"},
+    {"id": "gemini-1.5-pro-002"},
+    {"id": "gemini-exp-1114"},
+    {"id": "gemini-exp-1121"},
+    {"id": "gemini-exp-1206"},
+    {"id": "gemini-2.0-flash-exp"},
+    {"id": "gemini-2.0-exp"},
+    {"id": "gemini-2.0-pro-exp"},
+]
+@app.route('/hf/v1/chat/completions', methods=['POST'])
+def chat_completions():
+    global current_api_key
+    is_authenticated, auth_error, status_code = func.authenticate_request(PASSWORD, request)
+    if not is_authenticated:
+        return auth_error if auth_error else jsonify({'error': 'Unauthorized'}), status_code if status_code else 401
+    try:
+        request_data = request.get_json()
+        messages = request_data.get('messages', [])
+        model = request_data.get('model', 'gemini-exp-1206')
+        temperature = request_data.get('temperature', 1)
+        max_tokens = request_data.get('max_tokens', 8192)
+        stream = request_data.get('stream', False)
+        logger.info(f"\n{model} [r] -> {current_api_key[:11]}...")
+        gemini_history, user_message, error_response = func.process_messages_for_gemini(messages)
+        if error_response:
+            print(error_response)
+        genai.configure(api_key=current_api_key)
+        generation_config = {
+            "temperature": temperature,
+            "max_output_tokens": max_tokens
+        }
+        gen_model = genai.GenerativeModel(
+            model_name=model,
+            generation_config=generation_config,
+            safety_settings=safety_settings
+        )
+        if stream:
+            if gemini_history:
+                chat_session = gen_model.start_chat(history=gemini_history)
+                response = chat_session.send_message(user_message, stream=True)
+            else:
+                response = gen_model.generate_content(user_message, stream=True)
+            def generate():
+                try:
+                    for chunk in response:
+                        if chunk.text:
+                            data = {
+                                'choices': [
+                                    {
+                                        'delta': {
+                                            'content': chunk.text
+                                        },
+                                        'finish_reason': None,
+                                        'index': 0
+                                    }
+                                ],
+                                'object': 'chat.completion.chunk'
+                            }
+                            yield f"data: {json.dumps(data)}\n\n"
+                    data = {
+                        'choices': [
+                            {
+                                'delta': {},
+                                'finish_reason': 'stop',
+                                'index': 0
+                            }
+                        ],
+                        'object': 'chat.completion.chunk'
+                    }
+                    yield f"data: {json.dumps(data)}\n\n"
+                except Exception as e:
+                    logger.error(f"Error during streaming: {str(e)}")
+                    data = {
+                        'error': {
+                            'message': str(e),
+                            'type': 'internal_server_error'
+                        }
+                    }
+                    yield f"data: {json.dumps(data)}\n\n"
+            return Response(stream_with_context(generate()), mimetype='text/event-stream')
+        else:
+            if gemini_history:
+                chat_session = gen_model.start_chat(history=gemini_history)
+                response = chat_session.send_message(user_message)
+            else:
+                response = gen_model.generate_content(user_message)
+            try:
+                text_content = response.candidates[0].content.parts[0].text
+            except (AttributeError, IndexError, TypeError) as e:
+                logger.error(f"Error getting text content: {str(e)}")
+                text_content = "Error: Unable to get text content."
+            response_data = {
+                'id': 'chatcmpl-xxxxxxxxxxxx',
+                'object': 'chat.completion',
+                'created': int(datetime.now().timestamp()),
+                'model': model,
+                'choices': [{
+                    'index': 0,
+                    'message': {
+                        'role': 'assistant',
+                        'content': text_content
+                    },
+                    'finish_reason': 'stop'
+                }],
+                'usage':{
+                    'prompt_tokens': 0,
+                    'completion_tokens': 0,
+                    'total_tokens': 0
+                }
+            }
+            logger.info(f"Generation Success")
+            return jsonify(response_data)
+    except Exception as e:
+        logger.error(f"Error in chat completions: {str(e)}")
+        return jsonify({
+            'error': {
+                'message': str(e),
+                'type': 'invalid_request_error'
+            }
+        }), 500
+    finally:
+        current_api_key = key_manager.get_available_key()
+        logger.info(f"API KEY Switched -> {current_api_key[:11]}...")
+@app.route('/hf/v1/models', methods=['GET'])
+def list_models():
+    is_authenticated, auth_error, status_code = func.authenticate_request(PASSWORD, request)
+    if not is_authenticated:
+        return auth_error if auth_error else jsonify({'error': 'Unauthorized'}), status_code if status_code else 401
+    response = {"object": "list", "data": GEMINI_MODELS}
+    return jsonify(response)
+if __name__ == '__main__':
+    app.run(debug=True, host='0.0.0.0', port=int(os.environ.get('PORT', 7860)))

func.py ADDED Viewed

	@@ -0,0 +1,92 @@

+from io import BytesIO
+import base64
+from PIL import Image
+from flask import jsonify
+import logging
+import json
+import re
+logger = logging.getLogger(__name__)
+def authenticate_request(password, request):
+    auth_header = request.headers.get('Authorization')
+    if not auth_header:
+        return False, jsonify({'error': 'Authorization header is missing'}), 401
+    try:
+        auth_type, pass_word = auth_header.split(' ', 1)
+    except ValueError:
+        return False, jsonify({'error': 'Invalid Authorization header format'}), 401
+    if auth_type.lower() != 'bearer':
+        return False, jsonify({'error': 'Authorization type must be Bearer'}), 401
+    if pass_word != password:
+        return False, jsonify({'error': 'Unauthorized'}), 401
+    return True, None, None
+def process_messages_for_gemini(messages):
+    gemini_history = []
+    for message in messages:
+        role = message.get('role')
+        content = message.get('content')
+        if isinstance(content, str):  # 纯文本
+            if role == 'system':
+                gemini_history.append({"role": "user", "parts": [content]})
+            elif role == 'user':
+                gemini_history.append({"role": "user", "parts": [content]})
+            elif role == 'assistant':
+                gemini_history.append({"role": "model", "parts": [content]})
+        elif isinstance(content, list):  # 图文
+            parts = []
+            for item in content:
+                if item.get('type') == 'text':
+                    parts.append(item.get('text'))
+                elif item.get('type') == 'image_url':
+                    image_data = item.get('image_url', {}).get('url', '')
+                    if image_data.startswith('data:image/'):
+                        try:
+                            # 提取 base64 编码和图片类型
+                            image_type = image_data.split(';')[0].split('/')[1].upper()  # 提取图片类型并转为大写
+                            base64_image = image_data.split(';base64,')[1]
+                            image = Image.open(BytesIO(base64.b64decode(base64_image)))
+                            # 将图片转换为 RGB 模式
+                            if image.mode != 'RGB':
+                                image = image.convert('RGB')
+                            # 压缩图像
+                            if image.width > 2048 or image.height > 2048:
+                                image.thumbnail((2048, 2048))
+                            output_buffer = BytesIO()
+                            image.save(output_buffer, format=image_type)  # 使用原始图片类型保存
+                            output_buffer.seek(0)
+                            parts.append(image)
+                        except Exception as e:
+                            logger.error(f"Error processing image: {e}")
+                            return [], None, (jsonify({'error': 'Invalid image data'}), 400)
+                    else:
+                        return [], None, (jsonify({'error': 'Invalid image URL format'}), 400)
+            # 根据 role 添加到 gemini_history
+            if role in ['user', 'system']:
+                gemini_history.append({"role": "user", "parts": parts})
+            elif role == 'assistant':
+                gemini_history.append({"role": "model", "parts": parts})
+            else:
+                return [], None, (jsonify({'error': f'Invalid role: {role}'}), 400)
+    # 用户最后一条消息
+    if gemini_history:
+        user_message = gemini_history[-1]
+        gemini_history = gemini_history[:-1]  # 历史记录不包含最后一条消息
+    else:
+        user_message = {"role": "user", "parts": [""]}
+    return gemini_history, user_message, None

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+Flask==2.0.3
+Flask-CORS==3.0.10
+requests==2.26.0
+Werkzeug==2.0.3
+google==3.0.0
+google-generativeai==0.8.3
+pillow==10.4.0