Spaces:

Tonic
/

Native_1-bit_LLM

Running

App Files Files Community

AI-B commited on 10 days ago

Commit

e11a1c0

verified ·

1 Parent(s): 5760858

🔧🐢 Lazy Transformer Patch ⚡️✨

Browse files

# Edit description:
# - Switched from `transformers` dynamic loading to direct BitNet package imports
# - Imported BitNetConfig, BitNetTokenizer, BitNetForCausalLM from `bitnet`
# - Removed AutoConfig/AutoTokenizer/AutoModelForCausalLM calls (left imports for no reason; orphaned)
# - Note to update requirements: `pip install bitnet`

https://pypi.org/project/bitnet/

Files changed (1) hide show

app.py +10 -11

app.py CHANGED Viewed

@@ -2,6 +2,11 @@ import gradio as gr
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig
 # Singleton for model and tokenizer
 _model = None
 _tokenizer = None
@@ -10,19 +15,13 @@ def load_model():
     global _model, _tokenizer
     if _model is None or _tokenizer is None:
         model_id = "microsoft/bitnet-b1.58-2B-4T"
-        _tokenizer = AutoTokenizer.from_pretrained(
-            model_id,
-            trust_remote_code=True
-        )
-        config = AutoConfig.from_pretrained(
-            model_id,
-            trust_remote_code=True
-        )
-        _model = AutoModelForCausalLM.from_pretrained(
             model_id,
             config=config,
-            torch_dtype=torch.bfloat16,
-            trust_remote_code=True
         )
     return _model, _tokenizer

 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, AutoConfig
+# use the official bitnet package to supply the missing code
+from bitnet.configuration_bitnet import BitNetConfig
+from bitnet.modeling_bitnet import BitNetForCausalLM
+from bitnet.tokenization_bitnet import BitNetTokenizer
 # Singleton for model and tokenizer
 _model = None
 _tokenizer = None
     global _model, _tokenizer
     if _model is None or _tokenizer is None:
         model_id = "microsoft/bitnet-b1.58-2B-4T"
+        # load tokenizer, config, and model from the bitnet pip package
+        _tokenizer = BitNetTokenizer.from_pretrained(model_id)
+        config     = BitNetConfig.from_pretrained(model_id)
+        _model     = BitNetForCausalLM.from_pretrained(
             model_id,
             config=config,
+            torch_dtype=torch.bfloat16
         )
     return _model, _tokenizer