hiyouga
/

Qwen-14B-Chat-LLaMAfied

Text Generation

text-generation-inference

Model card Files Files and versions Community

hiyouga commited on Dec 31, 2023

Commit

11fa3e4

•

1 Parent(s): 29e92e7

Update README.md

Files changed (1) hide show

README.md +4 -6

README.md CHANGED Viewed

@@ -35,12 +35,10 @@ tokenizer = AutoTokenizer.from_pretrained("hiyouga/Qwen-14B-Chat-LLaMAfied")
 model = AutoModelForCausalLM.from_pretrained("hiyouga/Qwen-14B-Chat-LLaMAfied", torch_dtype="auto", device_map="auto")
 streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
-query = (
-    "<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n"
-    "<|im_start|>user\nWho are you?<|im_end|>\n"
-    "<|im_start|>assistant\n"
-)
-inputs = tokenizer([query], return_tensors="pt")
 inputs = inputs.to("cuda")
 generate_ids = model.generate(**inputs, eos_token_id=[151643, 151645], max_new_tokens=256, streamer=streamer)
 ```

 model = AutoModelForCausalLM.from_pretrained("hiyouga/Qwen-14B-Chat-LLaMAfied", torch_dtype="auto", device_map="auto")
 streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
+messages = [
+    {"role": "user", "content": "Who are you?"}
+]
+inputs = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt")
 inputs = inputs.to("cuda")
 generate_ids = model.generate(**inputs, eos_token_id=[151643, 151645], max_new_tokens=256, streamer=streamer)
 ```