universitytehran
/

PersianMind-v1.0

Text Generation

text-generation-inference

Model card Files Files and versions Community

Pedram Rostami commited on Jan 22, 2024

Commit

9aad44b

·

verified ·

1 Parent(s): dd07a7b

Update README.md

Files changed (1) hide show

README.md +1 -2

README.md CHANGED Viewed

@@ -72,9 +72,8 @@ input_tokens = tokenizer(model_input, return_tensors="pt")
 input_tokens = input_tokens.to(device)
 generate_ids = model.generate(**input_tokens, max_new_tokens=512, do_sample=False, repetition_penalty=1.1)
 model_output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
-model_output = model_output.replace(model_input, "")
-print(model_output)
 ```
 ### How to Quantize the Model

 input_tokens = input_tokens.to(device)
 generate_ids = model.generate(**input_tokens, max_new_tokens=512, do_sample=False, repetition_penalty=1.1)
 model_output = tokenizer.batch_decode(generate_ids, skip_special_tokens=True, clean_up_tokenization_spaces=False)[0]
+print(model_output[len(model_input) + 1: ])
 ```
 ### How to Quantize the Model