norallm
/

normistral-11b-warm

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

davda54 commited on 10 days ago

Commit

6344c0e

•

1 Parent(s): 8d33c81

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -161,7 +161,7 @@ For systems with limited VRAM, you can load the model in 8-bit or 4-bit quantiza
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
-tokenizer = AutoTokenizer.from_pretrained("norallm/normistral-11b")
 # Load in 8-bit mode (requires ~12GB VRAM)
 model = AutoModelForCausalLM.from_pretrained(

 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("norallm/normistral-11b-warm")
 # Load in 8-bit mode (requires ~12GB VRAM)
 model = AutoModelForCausalLM.from_pretrained(