baichuan-inc
/

Baichuan-7B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DanielWang commited on Jun 15, 2023

Commit

a1ee998

·

1 Parent(s): c2549d7

Update README.md

update inference case

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -35,9 +35,9 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/baichuan-7B", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("baichuan-inc/baichuan-7B", device_map="auto", trust_remote_code=True)
-inputs = tokenizer('登鹳雀楼->王之涣\n夜雨寄北->\n', return_tensors='pt')
 inputs = inputs.to('cuda:0')
-pred = model.generate(**inputs, max_new_tokens=512, do_sample=True)
 print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```
@@ -47,9 +47,9 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/baichuan-7B", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("baichuan-inc/baichuan-7B", device_map="auto", trust_remote_code=True)
-inputs = tokenizer('Hamlet->Shakespeare\nOne Hundred Years of Solitude->\n', return_tensors='pt')
 inputs = inputs.to('cuda:0')
-pred = model.generate(**inputs, max_new_tokens=512, do_sample=True)
 print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```

 tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/baichuan-7B", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("baichuan-inc/baichuan-7B", device_map="auto", trust_remote_code=True)
+inputs = tokenizer('登鹳雀楼->王之涣\n夜雨寄北->', return_tensors='pt')
 inputs = inputs.to('cuda:0')
+pred = model.generate(**inputs, max_new_tokens=64)
 print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```
 tokenizer = AutoTokenizer.from_pretrained("baichuan-inc/baichuan-7B", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("baichuan-inc/baichuan-7B", device_map="auto", trust_remote_code=True)
+inputs = tokenizer('Hamlet->Shakespeare\nOne Hundred Years of Solitude->', return_tensors='pt')
 inputs = inputs.to('cuda:0')
+pred = model.generate(**inputs, max_new_tokens=64)
 print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
 ```