Spaces:

Kukedlc
/

QWEN-2.5-Coder-7B

Runtime error

App Files Files Community

Kukedlc commited on Sep 15, 2024

Commit

c98587e

verified ·

1 Parent(s): 2cbff7e

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -20

app.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import gradio as gr
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 titulo = """# 🤖 Bienvenido al Chatbot con Yi-9B"""
@@ -16,51 +17,48 @@ tokenizador = AutoTokenizer.from_pretrained(ruta_modelo)
 modelo = AutoModelForCausalLM.from_pretrained(ruta_modelo, device_map="auto").eval()
 @spaces.GPU(duration=130)
-def generar_respuesta(historial, usuario_input, max_longitud):
     mensajes = [
-        {"role": "system", "content": "Eres un asistente útil y amigable. Proporciona respuestas claras y concisas."}
     ]
-    for entrada in historial:
-        mensajes.append({"role": "user", "content": entrada[0]})
-        mensajes.append({"role": "assistant", "content": entrada[1]})
-    mensajes.append({"role": "user", "content": usuario_input})
     texto = tokenizador.apply_chat_template(
         mensajes,
         tokenize=False,
         add_generation_prompt=True
     )
     entradas_modelo = tokenizador([texto], return_tensors="pt").to(dispositivo)
     ids_generados = modelo.generate(
         entradas_modelo.input_ids,
         max_new_tokens=max_longitud,
         eos_token_id=tokenizador.eos_token_id
     )
     ids_generados = [
         output_ids[len(input_ids):] for input_ids, output_ids in zip(entradas_modelo.input_ids, ids_generados)
     ]
     respuesta = tokenizador.batch_decode(ids_generados, skip_special_tokens=True)[0]
-    historial.append((usuario_input, respuesta))
-    return historial, ""
 def interfaz_gradio():
     with gr.Blocks() as interfaz:
         gr.Markdown(titulo)
         gr.Markdown(descripcion)
-        chatbot = gr.Chatbot(label="Historial de chat")
-        msg = gr.Textbox(label="Tu mensaje")
-        clear = gr.Button("Limpiar")
         max_longitud_slider = gr.Slider(minimum=1, maximum=1000, value=500, label="Longitud máxima de la respuesta")
-        msg.submit(generar_respuesta, [chatbot, msg, max_longitud_slider], [chatbot, msg])
-        clear.click(lambda: None, None, chatbot, queue=False)
     return interfaz

 import gradio as gr
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
+import spaces
 titulo = """# 🤖 Bienvenido al Chatbot con Yi-9B"""
 modelo = AutoModelForCausalLM.from_pretrained(ruta_modelo, device_map="auto").eval()
 @spaces.GPU(duration=130)
+def generar_respuesta(prompt_sistema, prompt_usuario, max_longitud):
     mensajes = [
+        {"role": "system", "content": prompt_sistema},
+        {"role": "user", "content": prompt_usuario}
     ]
     texto = tokenizador.apply_chat_template(
         mensajes,
         tokenize=False,
         add_generation_prompt=True
     )
     entradas_modelo = tokenizador([texto], return_tensors="pt").to(dispositivo)
     ids_generados = modelo.generate(
         entradas_modelo.input_ids,
         max_new_tokens=max_longitud,
         eos_token_id=tokenizador.eos_token_id
     )
     ids_generados = [
         output_ids[len(input_ids):] for input_ids, output_ids in zip(entradas_modelo.input_ids, ids_generados)
     ]
     respuesta = tokenizador.batch_decode(ids_generados, skip_special_tokens=True)[0]
+    return respuesta
 def interfaz_gradio():
     with gr.Blocks() as interfaz:
         gr.Markdown(titulo)
         gr.Markdown(descripcion)
+        prompt_sistema = gr.Textbox(
+            label="Instrucción del sistema:",
+            value="Eres un asistente útil y amigable. Proporciona respuestas claras y concisas.",
+            lines=2
+        )
+        prompt_usuario = gr.Textbox(label="Tu mensaje", lines=3)
+        respuesta = gr.Textbox(label="Respuesta del asistente", lines=10)
         max_longitud_slider = gr.Slider(minimum=1, maximum=1000, value=500, label="Longitud máxima de la respuesta")
+        boton_generar = gr.Button("Generar respuesta")
+        boton_generar.click(
+            generar_respuesta,
+            inputs=[prompt_sistema, prompt_usuario, max_longitud_slider],
+            outputs=respuesta
+        )
     return interfaz