experimental-kphi-3-nano-4k-instruct-gradio-autoloader

Sleeping

schuler commited on Dec 3, 2024

Commit

3d905f8

verified ·

1 Parent(s): 72f7511

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import gradio as gr
 import os, sys
 from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig, pipeline
 import torch
 import spaces
 import psutil
@@ -13,7 +14,8 @@ REPO_NAME = 'schuler/experimental-JP47D20'
 # How to cache?
 @spaces.GPU()
 def load_model(repo_name):
-    tokenizer = AutoTokenizer.from_pretrained(repo_name, trust_remote_code=True)
     generator_conf = GenerationConfig.from_pretrained(repo_name)
     model = AutoModelForCausalLM.from_pretrained(repo_name, trust_remote_code=True, torch_dtype=torch.bfloat16, attn_implementation="eager")
     # model.to('cuda')

 import os, sys
 from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig, pipeline
+from transformers import LlamaTokenizer
 import torch
 import spaces
 import psutil
 # How to cache?
 @spaces.GPU()
 def load_model(repo_name):
+    # tokenizer = AutoTokenizer.from_pretrained(repo_name, trust_remote_code=True)
+    tokenizer = LlamaTokenizer.from_pretrained(repo_name, trust_remote_code=True)
     generator_conf = GenerationConfig.from_pretrained(repo_name)
     model = AutoModelForCausalLM.from_pretrained(repo_name, trust_remote_code=True, torch_dtype=torch.bfloat16, attn_implementation="eager")
     # model.to('cuda')