Spaces:

hey1800
/

lab

Runtime error

hey1800 commited on Jul 24, 2024

Commit

4e931e5

verified ·

1 Parent(s): 1e99b77

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,13 @@
 import gradio as gr
-from transformers import AutoTokenizer, GPTJForCausalLM, BitsAndBytesConfig
-import torch
 model_name = "rycont/kakaobrain__kogpt-6b-8bit"
-# BitsAndBytesConfig 설정
-bnb_config = BitsAndBytesConfig(load_in_8bit=True)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = GPTJForCausalLM.from_pretrained(model_name, device_map="auto", quantization_config=bnb_config)
 def generate_response(prompt):
-    inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
     outputs = model.generate(inputs['input_ids'], max_new_tokens=50)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
@@ -20,7 +16,7 @@ iface = gr.Interface(
     fn=generate_response,
     inputs="text",
     outputs="text",
-    title="KoGPT-6B 8bit Chatbot",
     description="Enter a prompt and the model will generate a response."
 )

 import gradio as gr
+from transformers import AutoTokenizer, GPTJForCausalLM
 model_name = "rycont/kakaobrain__kogpt-6b-8bit"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = GPTJForCausalLM.from_pretrained(model_name)
 def generate_response(prompt):
+    inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(inputs['input_ids'], max_new_tokens=50)
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return response
     fn=generate_response,
     inputs="text",
     outputs="text",
+    title="KoGPT-6B Chatbot",
     description="Enter a prompt and the model will generate a response."
 )