seawolf2357's picture
Update app.py
7a27471 verified
raw
history blame
1.58 kB
import gradio as gr
import requests
import os
ACCESS_TOKEN = os.getenv("HF_TOKEN")
def respond(message, history: list[tuple[str, str]], system_message, max_tokens, temperature, top_p):
messages = [{"role": "system", "content": system_message}]
for val in history:
if val[0]:
messages.append({"role": "user", "content": val[0]})
if val[1]:
messages.append({"role": "assistant", "content": val[1]})
messages.append({"role": "user", "content": message})
# 사용자의 최종 메시지를 포함한 전체 메시지 리스트를 JSON 형식으로 구성
data = {
"model": "command-r-plus:104b-fp16",
"prompt": message,
"max_tokens": max_tokens,
"temperature": temperature,
"top_p": top_p
}
# API 요청 보내기
response = requests.post("http://hugpu.ai:7877/api/generate", json=data)
generated_text = response.json().get('generated_text', '') # 응답에서 생성된 텍스트 추출
return generated_text # 생성된 텍스트 반환
chatbot = gr.Chatbot(height=600)
demo = gr.Interface(
fn=respond,
inputs=[
gr.Textbox(label="Your Message"),
gr.Textbox(value="", label="System message"),
gr.Slider(minimum=1, maximum=2048, value=512, label="Max new tokens"),
gr.Slider(minimum=0.1, maximum=4.0, value=0.7, label="Temperature"),
gr.Slider(minimum=0.1, maximum=1.0, value=0.95, label="Top-P")
],
outputs=chatbot,
theme="Nymbo/Nymbo_Theme"
)
if __name__ == "__main__":
demo.launch()