Spaces:

joaogante
/

assisted_generation_demo

Runtime error

joaogante HF staff commited on Aug 21, 2024

Commit

fdf5fbd

verified ·

1 Parent(s): e8e07e2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,8 +8,8 @@ import time
 model_id = "facebook/opt-6.7b"
 assistant_id = "facebook/opt-125m"
-model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float16, device_map="auto")
-assistant_model = AutoModelForCausalLM.from_pretrained(assistant_id).to(device=model.device, dtype=torch.float16)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 def run_generation(user_text, use_assistant, temperature, max_new_tokens):

 model_id = "facebook/opt-6.7b"
 assistant_id = "facebook/opt-125m"
+model = AutoModelForCausalLM.from_pretrained(model_id, load_in_8bit=True, device_map="auto")
+assistant_model = AutoModelForCausalLM.from_pretrained(assistant_id).to(device=model.device, dtype=torch.bfloat16)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 def run_generation(user_text, use_assistant, temperature, max_new_tokens):