Spaces:

tryolabs
/

blogpost-cqa

Running

App Files Files Community

rgallardo commited on Dec 26, 2022

Commit

c152a6e

•

1 Parent(s): 92360e8

Create chatbot interface

Browse files

Files changed (3) hide show

.gitignore +1 -0
app.py +34 -13
requirements.txt +7 -1

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ onnx

app.py CHANGED Viewed

@@ -1,28 +1,39 @@
-from transformers import LongT5ForConditionalGeneration, AutoTokenizer
 import time
 N = 2 # Number of previous QA pairs to use for context
 MAX_NEW_TOKENS = 128 # Maximum number of tokens for each answer
-tokenizer = AutoTokenizer.from_pretrained("tryolabs/long-t5-tglobal-base-blogpost-cqa")
-model = LongT5ForConditionalGeneration.from_pretrained("tryolabs/long-t5-tglobal-base-blogpost-cqa")
 with open("context_short.txt", "r") as f:
  context = f.read()
-def build_input(question, user_history=[], bot_history=[]):
  model_input = f"{context} || "
- previous = min(len(bot_history[1:]), N)
  for i in range(previous, 0, -1):
- prev_question = user_history[-i-1]
- prev_answer = bot_history[-i]
  model_input += f"<Q{i}> {prev_question} <A{i}> {prev_answer} "
  model_input += f"<Q> {question} <A> "
  return model_input
-def get_model_answer(question, user_history=[], bot_history=[]):
  start = time.perf_counter()
- model_input = build_input(question, user_history, bot_history)
  end = time.perf_counter()
  print(f"Build input: {end-start}")
  start = time.perf_counter()
@@ -34,11 +45,21 @@ def get_model_answer(question, user_history=[], bot_history=[]):
  end = time.perf_counter()
  print(f"Tokenize: {end-start}")
  start = time.perf_counter()
- encoded_output = model.generate(input_ids=input_ids, attention_mask=attention_mask, do_sample=True, max_new_tokens=MAX_NEW_TOKENS)
  answer = tokenizer.decode(encoded_output[0], skip_special_tokens=True)
  end = time.perf_counter()
  print(f"Generate: {end-start}")
- user_history.append(question)
- bot_history.append(answer)
- return answer, user_history, bot_history

+from transformers import AutoTokenizer
 import time
+import gradio as gr
+from optimum.onnxruntime import ORTModelForSeq2SeqLM
+from optimum.utils import NormalizedConfigManager
+@classmethod
+def _new_get_normalized_config_class(cls, model_type):
+ return cls._conf["t5"]
+NormalizedConfigManager.get_normalized_config_class = _new_get_normalized_config_class
 N = 2 # Number of previous QA pairs to use for context
 MAX_NEW_TOKENS = 128 # Maximum number of tokens for each answer
+tokenizer = AutoTokenizer.from_pretrained("tryolabs/long-t5-tglobal-base-blogpost-cqa-onnx")
+model = ORTModelForSeq2SeqLM.from_pretrained("tryolabs/long-t5-tglobal-base-blogpost-cqa-onnx")
 with open("context_short.txt", "r") as f:
  context = f.read()
+def build_input(question, state=[[],[]]):
  model_input = f"{context} || "
+ previous = min(len(state[1][1:]), N)
  for i in range(previous, 0, -1):
+ prev_question = state[0][-i-1]
+ prev_answer = state[1][-i]
  model_input += f"<Q{i}> {prev_question} <A{i}> {prev_answer} "
  model_input += f"<Q> {question} <A> "
  return model_input
+def get_model_answer(question, state=[[],[]]):
  start = time.perf_counter()
+ model_input = build_input(question, state)
  end = time.perf_counter()
  print(f"Build input: {end-start}")
  start = time.perf_counter()
  end = time.perf_counter()
  print(f"Tokenize: {end-start}")
  start = time.perf_counter()
+ encoded_output = model.generate(input_ids=input_ids, attention_mask=attention_mask, max_new_tokens=MAX_NEW_TOKENS)
  answer = tokenizer.decode(encoded_output[0], skip_special_tokens=True)
  end = time.perf_counter()
  print(f"Generate: {end-start}")
+ state[0].append(question)
+ state[1].append(answer)
+ responses = [(state[0][i], state[1][i]) for i in range(len(state[0]))]
+ return responses, state
+with gr.Blocks() as demo:
+ state = gr.State([[],[]])
+ chatbot = gr.Chatbot()
+ text = gr.Textbox(label="Ask a question (press enter to submit)", default_value="How are you?")
+ text.submit(get_model_answer, [text, state], [chatbot, state])
+ text.submit(lambda x: "", text, text)
+demo.launch()

requirements.txt CHANGED Viewed

@@ -1,2 +1,8 @@
 transformers
-torch

 transformers
+torch
+onnx==1.12.0
+onnxconverter-common==1.13.0
+onnxruntime==1.13.1
+onnxruntime-tools==1.7.0
+openvino==2022.2.0
+optimum @ git+https://github.com/huggingface/optimum.git@4c3b1c14f07c8e3780d9c9765b3992a90fab3349