Spaces:

aakashv100
/

phi3-oass1-chatbot

Runtime error

Aakash Vardhan commited on Sep 18, 2024

Commit

e6c656b

1 Parent(s): c4cedc2

.

Files changed (1) hide show

app.py CHANGED Viewed

@@ -42,13 +42,23 @@ def respond(
     temperature,
     top_p,
 ):
-    # Construct the input prompt
-    prompt = f"{system_message}\n\n"
     for user, assistant in history:
-        prompt += f"Human: {user}\nAssistant: {assistant}\n"
-    prompt += f"Human: {message}\nAssistant:"
-    # Generate the response
     response = ""
     for output in pipe(
         prompt,
@@ -56,9 +66,11 @@ def respond(
         do_sample=True,
         temperature=temperature,
         top_p=top_p,
-        streamer=None,  # Use default streamer
     ):
-        new_text = output[0]["generated_text"][len(prompt) :]
         response += new_text
         yield response.strip()
@@ -81,7 +93,7 @@ demo = gr.ChatInterface(
             label="System message",
         ),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
@@ -90,6 +102,8 @@ demo = gr.ChatInterface(
             label="Top-p (nucleus sampling)",
         ),
     ],
 )

     temperature,
     top_p,
 ):
+    # Construct the chat list
+    chat_list = [{"role": "system", "content": system_message}]
     for user, assistant in history:
+        chat_list.extend(
+            [
+                {"role": "user", "content": user},
+                {"role": "assistant", "content": assistant},
+            ]
+        )
+    chat_list.append({"role": "user", "content": message})
+    # Apply chat template
+    prompt = pipe.tokenizer.apply_chat_template(
+        chat_list, tokenize=False, add_generation_prompt=True
+    )
+    # Generate response with streaming
     response = ""
     for output in pipe(
         prompt,
         do_sample=True,
         temperature=temperature,
         top_p=top_p,
+        num_beams=1,
+        top_k=50,
+        streamer=gr.utils.Iteratorize(),
     ):
+        new_text = output[0]['generated_text'][len(prompt) + len(response):]
         response += new_text
         yield response.strip()
             label="System message",
         ),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
+        gr.Slider(minimum=0.1, maximum=2.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(
             minimum=0.1,
             maximum=1.0,
             label="Top-p (nucleus sampling)",
         ),
     ],
+    title="General Knowledge Assistant",
+    description="Ask me anything about general knowledge. I'll try to answer succinctly using first principles.",
 )