Mike0307
/

Phi-3-mini-4k-instruct-chinese-lora

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Mike0307 commited on May 17, 2024

Commit

735cb24

·

verified ·

1 Parent(s): 4e7a567

Update README.md

Files changed (1) hide show

README.md +40 -5

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ pipeline_tag: text-generation
 ---
-## Download the model
 The base-model [microsoft/Phi-3-mini-4k-instruct](https://huggingface.co/microsoft/Phi-3-mini-4k-instruct) currently relies on
 the latest dev-version transformers and torch.<br>
@@ -43,11 +43,15 @@ model = AutoModelForCausalLM.from_pretrained(
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 ```
-## Example of inference
 ```python
 input_text = "<|user|>將這五種動物分成兩組。\n老虎、鯊魚、大象、鯨魚、袋鼠 <|end|>\n<|assistant|>"
-inputs = tokenizer(input_text, return_tensors="pt").to(torch.device("mps")) # FIX mps if not MacOS
 outputs = model.generate(
     **inputs,
@@ -56,6 +60,37 @@ outputs = model.generate(
     do_sample = False
 )
-generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
 print(generated_text)
-```

 ---
+## Download Model
 The base-model [microsoft/Phi-3-mini-4k-instruct](https://huggingface.co/microsoft/Phi-3-mini-4k-instruct) currently relies on
 the latest dev-version transformers and torch.<br>
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 ```
+## Inference Example
 ```python
 input_text = "<|user|>將這五種動物分成兩組。\n老虎、鯊魚、大象、鯨魚、袋鼠 <|end|>\n<|assistant|>"
+inputs = tokenizer(
+    input_text,
+    return_tensors="pt"
+).to(torch.device("mps")) # Change mps if not MacOS
 outputs = model.generate(
     **inputs,
     do_sample = False
 )
+generated_text = tokenizer.decode(
+    outputs[0],
+    skip_special_tokens=True
+)
+print(generated_text)
+```
+## Streaming Example
+```python
+from transformers import TextStreamer
+streamer = TextStreamer(tokenizer)
+input_text = "<|user|>將這五種動物分成兩組。\n老虎、鯊魚、大象、鯨魚、袋鼠 <|end|>\n<|assistant|>"
+inputs = tokenizer(
+    input_text,
+    return_tensors="pt"
+).to(torch.device("mps")) # Change mps if not MacOS
+outputs = model.generate(
+    **inputs,
+    temperature = 0.0,
+    do_sample = False,
+    streamer=streamer,
+    max_new_tokens=20,
+)
+generated_text = tokenizer.decode(
+    outputs[0],
+    skip_special_tokens=True
+)
 print(generated_text)
+```