Spaces:
Running
Running
import gradio as gr | |
import requests | |
import os | |
ACCESS_TOKEN = os.getenv("HF_TOKEN") | |
def respond(message, history: list[tuple[str, str]], system_message, max_tokens, temperature, top_p): | |
messages = [{"role": "system", "content": system_message}] | |
for val in history: | |
if val[0]: | |
messages.append({"role": "user", "content": val[0]}) | |
if val[1]: | |
messages.append({"role": "assistant", "content": val[1]}) | |
messages.append({"role": "user", "content": message}) | |
# 사용자의 최종 메시지를 포함한 전체 메시지 리스트를 JSON 형식으로 구성 | |
data = { | |
"model": "command-r-plus:104b-fp16", | |
"prompt": message, | |
"max_tokens": max_tokens, | |
"temperature": temperature, | |
"top_p": top_p | |
} | |
# API 요청 보내기 | |
response = requests.post("http://hugpu.ai:7877/api/generate", json=data) | |
generated_text = response.json().get('generated_text', '') # 응답에서 생성된 텍스트 추출 | |
return generated_text # 생성된 텍스트 반환 | |
chatbot = gr.Chatbot(height=600) | |
demo = gr.Interface( | |
fn=respond, | |
inputs=[ | |
gr.Textbox(label="Your Message"), | |
gr.Textbox(value="", label="System message"), | |
gr.Slider(minimum=1, maximum=2048, value=512, label="Max new tokens"), | |
gr.Slider(minimum=0.1, maximum=4.0, value=0.7, label="Temperature"), | |
gr.Slider(minimum=0.1, maximum=1.0, value=0.95, label="Top-P") | |
], | |
outputs=chatbot, | |
theme="Nymbo/Nymbo_Theme" | |
) | |
if __name__ == "__main__": | |
demo.launch() | |