Spaces:
Runtime error
Runtime error
File size: 2,050 Bytes
1cb9e76 8a0ed94 1cb9e76 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
import gradio as gr
import requests
import json
def http_bot(prompt, history, system_prompt, endpoint_url):
print(prompt, history, system_prompt, endpoint_url)
prompt = f"### Instruction:\n{system_prompt}\n\n### Input:\n{prompt}\n\n### Response:\n"
headers = {"User-Agent": "vLLM Client"}
pload = {
"prompt": prompt,
"stream": True,
"max_tokens": 3000,
}
response = requests.post(endpoint_url,
headers=headers,
json=pload,
stream=True)
for chunk in response.iter_lines(chunk_size=8192,
decode_unicode=False,
delimiter=b"\0"):
if chunk:
data = json.loads(chunk.decode("utf-8"))
output = data["text"][0]
yield output[len(prompt):]
with gr.Blocks(theme=gr.themes.Soft(), title="DanskGPT") as demo:
gr.Markdown("# DanskGPT v0.3 - offline. Hvis du vil have en demo, så kontakt mig. Kontaktinformation nederst.")
gr.Markdown("Et dansk alternativ til ChatGPT der kører lokalt.")
system_prompt = gr.Textbox(value="Du er en dansk AI-assistent. Du vil blive givet en opgave. Du skal hjælpe så meget du kan.",
label="System besked")
endpoint_url = gr.Textbox(label="Endpoint url", value="https://h6lsu4k84eqhh4-8000.proxy.runpod.net/generate", render=False)
gr.ChatInterface(
http_bot,
additional_inputs=[system_prompt, endpoint_url],
clear_btn=None,
undo_btn=None,
retry_btn=None,
submit_btn="Send",
)
gr.Markdown("Version 0.3 - instruktionsmodel trænet på data op til 31-06-2023.")
gr.Markdown("Lavet af Mads Henrichsen - Kontakt: [email protected]")
gr.Markdown("Bemærk: DanskGPT producerer ikke nødvendigvis sandfærdig information - der er en ny model på vej der er meget bedre til dette.")
demo.queue(concurrency_count=100).launch()
|