WangZeJun
/

bloom-820m-chat

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

WangZeJun commited on Jun 2, 2023

Commit

abd7c44

•

1 Parent(s): 71b1533

Update README.md

Files changed (1) hide show

README.md +24 -0

README.md CHANGED Viewed

@@ -1,3 +1,27 @@
 ---
 license: bigscience-bloom-rail-1.0
 ---

 ---
 license: bigscience-bloom-rail-1.0
 ---
+https://github.com/zejunwang1/bloom_tuning
+```python
+from transformers import BloomTokenizerFast, BloomForCausalLM
+model_name_or_path = "WangZeJun/bloom-820m-chat"
+tokenizer = BloomTokenizerFast.from_pretrained(model_name_or_path)
+model = BloomForCausalLM.from_pretrained(model_name_or_path).cuda()
+model = model.eval()
+input_pattern = "{}</s>"
+text = "你好"
+input_ids = tokenizer(input_pattern.format(text), return_tensors="pt").input_ids
+input_ids = input_ids.cuda()
+outputs = model.generate(input_ids, do_sample=True, max_new_tokens=1024, top_p=0.85,
+ temperature=0.3, repetition_penalty=1.2, eos_token_id=tokenizer.eos_token_id)
+output = tokenizer.decode(outputs[0])
+response = output.replace(text, "").replace('</s>', "")
+print(response)
+```