rhaymison commited on
Commit
53cfc34
1 Parent(s): 2c78e40

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +13 -0
README.md CHANGED
@@ -128,6 +128,19 @@ _ = model.generate(**inputs, streamer=streamer, max_new_tokens=200, temperature=
128
 
129
  ### Inferences in 4bits
130
 
 
 
 
 
 
 
 
 
 
 
 
 
 
131
  ```python
132
  runtimeFlag = "cuda:0"
133
  inputs = tokenizer([f"""<s>Você é um assistente especializado no Nordeste Do Brasil.
 
128
 
129
  ### Inferences in 4bits
130
 
131
+ ```python
132
+ nf4_config = BitsAndBytesConfig(
133
+ load_in_4bit=True,
134
+ bnb_4bit_quant_type="nf4",
135
+ bnb_4bit_use_double_quant=True,
136
+ bnb_4bit_compute_dtype=torch.bfloat16
137
+ )
138
+
139
+ model = AutoModelForCausalLM.from_pretrained("rhaymison/cuscuz-7b", quantization_config=nf4_config, device_map= {"": 0})
140
+ tokenizer = AutoTokenizer.from_pretrained("rhaymison/cuscuz-7b")
141
+
142
+ ```
143
+
144
  ```python
145
  runtimeFlag = "cuda:0"
146
  inputs = tokenizer([f"""<s>Você é um assistente especializado no Nordeste Do Brasil.