firqaaa
/

indo-alpaca-lora-7b

Text Generation

Inference Endpoints

Model card Files Files and versions Community

firqaaa commited on Apr 7, 2023

Commit

ed5c33f

·

1 Parent(s): 056d53a

Update README.md

Files changed (1) hide show

README.md +46 -3

README.md CHANGED Viewed

@@ -4,9 +4,9 @@ language:
 pipeline_tag: conversational
 ---
-## How to Use
-'python
 import torch
 import bitsandbytes as bnb
 from transformers import LlamaTokenizer, LlamaForCausalLM, GenerationConfig
@@ -19,4 +19,47 @@ model = LlamaForCausalLM.from_pretrained("decapoda-research/llama-7b-hf",
                                          load_in_8bit=True,
                                          device_map="auto")
 # Load the LoRA model
-model = PeftModel.from_pretrained(model, peft_model_id)'

 pipeline_tag: conversational
 ---
+# How to Use
+```python
 import torch
 import bitsandbytes as bnb
 from transformers import LlamaTokenizer, LlamaForCausalLM, GenerationConfig
                                          load_in_8bit=True,
                                          device_map="auto")
 # Load the LoRA model
+model = PeftModel.from_pretrained(model, peft_model_id)
+def generate_prompt(instruction, input=None):
+    if input:
+        return f"""Berikut ini adalah petunjuk yang menjelaskan tugas, serta masukan yang menyediakan konteks tambahan. Tulis balasan yang melengkapi permintaan dengan tepat.
+Petunjuk:
+{instruction}
+Masukan:
+{input}
+Output:"""
+    else:
+        return f"""Berikut ini terdapat panduan yang menjelaskan tugas. Mohon tuliskan balasan yang melengkapi permintaan dengan tepat.
+Panduan:
+{instruction}
+Output:"""
+generation_config = GenerationConfig(
+    temperature=0.2,
+    top_p=0.75,
+    num_beams=8
+)
+def evaluate(instruction, input=None):
+    prompt = generate_prompt(instruction, input)
+    inputs = tokenizer(prompt, return_tensors="pt")
+    input_ids = inputs["input_ids"].cuda()
+    generation_output = model.generate(
+        input_ids=input_ids,
+        generation_config=generation_config,
+        return_dict_in_generate=True,
+        output_scores=True,
+        max_new_tokens=256
+    )
+    for s in generation_output.sequences:
+        output = tokenizer.decode(s)
+        print("Output:", output.split("Output:")[1].strip())
+```