Spaces:

ctn8176
/

writerUI

Runtime error

ctn8176 commited on Jan 22, 2024

Commit

0a2c880

verified ·

1 Parent(s): d903275

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM, TextGenerationPipeline
 import gradio as gr
 model_name = "Writer/palmyra-small"
@@ -7,7 +7,28 @@ tokenizer = AutoTokenizer.from_pretrained(model_name)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = AutoModelForCausalLM.from_pretrained(model_name).to(device)
-text_generator = TextGenerationPipeline(model=model, tokenizer=tokenizer)
-iface = gr.Interface(fn=text_generator, inputs="text", outputs="text")
-iface.launch()

 import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 model_name = "Writer/palmyra-small"
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = AutoModelForCausalLM.from_pretrained(model_name).to(device)
+def generate_response(prompt):
+    input_text_template = (
+        "A chat between a curious user and an artificial intelligence assistant. "
+        "The assistant gives helpful, detailed, and polite answers to the user's questions. "
+        f"USER: {prompt} "
+        "ASSISTANT:"
+    )
+    model_inputs = tokenizer(input_text_template, return_tensors="pt").to(device)
+    gen_conf = {
+        "top_k": 20,
+        "max_length": 200,
+        "temperature": 0.6,
+        "do_sample": True,
+        "eos_token_id": tokenizer.eos_token_id,
+    }
+    output = model.generate(**model_inputs, **gen_conf)
+    generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
+    return generated_text
+iface = gr.Interface(fn=generate_response, inputs="text", outputs="text")
+iface.launch()