Spaces:

tianyang
/

lemur-7B

Runtime error

tianyang commited on Jun 16, 2023

Commit

b143c1f

1 Parent(s): 84fc3d3

Update utils/inference.py

Files changed (1) hide show

utils/inference.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import torch
-from transformers import LlamaTokenizer, LlamaForCausalLM
 from peft import PeftModel
 from typing import Iterator
 from variables import SYSTEM, HUMAN, AI
@@ -24,15 +24,15 @@ def load_tokenizer_and_model(base_model, adapter_model, load_8bit=True):
             device = "mps"
     except:
         pass
-    tokenizer = LlamaTokenizer.from_pretrained(base_model)
     if device == "cuda":
-        model = LlamaForCausalLM.from_pretrained(
             base_model,
             load_in_8bit=load_8bit,
             torch_dtype=torch.float16
         )
     elif device == "mps":
-        model = LlamaForCausalLM.from_pretrained(
             base_model,
             device_map={"": device}
         )
@@ -44,7 +44,7 @@ def load_tokenizer_and_model(base_model, adapter_model, load_8bit=True):
                 torch_dtype=torch.float16,
             )
     else:
-        model = LlamaForCausalLM.from_pretrained(
             base_model,
             device_map={"": device},
             low_cpu_mem_usage=True,
@@ -76,7 +76,7 @@ shared_state = State()
 def decode(
     input_ids: torch.Tensor,
     model: PeftModel,
-    tokenizer: LlamaTokenizer,
     stop_words: list,
     max_length: int,
     temperature: float = 1.0,

 import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 from typing import Iterator
 from variables import SYSTEM, HUMAN, AI
             device = "mps"
     except:
         pass
+    tokenizer = AutoTokenizer.from_pretrained(base_model)
     if device == "cuda":
+        model = AutoModelForCausalLM.from_pretrained(
             base_model,
             load_in_8bit=load_8bit,
             torch_dtype=torch.float16
         )
     elif device == "mps":
+        model = AutoModelForCausalLM.from_pretrained(
             base_model,
             device_map={"": device}
         )
                 torch_dtype=torch.float16,
             )
     else:
+        model = AutoModelForCausalLM.from_pretrained(
             base_model,
             device_map={"": device},
             low_cpu_mem_usage=True,
 def decode(
     input_ids: torch.Tensor,
     model: PeftModel,
+    tokenizer: AutoTokenizer,
     stop_words: list,
     max_length: int,
     temperature: float = 1.0,