mtc commited on
Commit
7316aed
1 Parent(s): acca9e7

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +115 -0
README.md ADDED
@@ -0,0 +1,115 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ datasets:
4
+ - mtc/absinth_german_faithfulness_detection_dataset
5
+ language:
6
+ - de
7
+ pipeline_tag: text-generation
8
+ ---
9
+ # Model Card for LeoLM-leo-mistral-Absinth
10
+ This model is a finetuned version of the [LeoLM/leo-mistral-hessianai-7b ](https://huggingface.co/LeoLM/leo-mistral-hessianai-7b). The model was finetuned on the [Absinth dataset]((https://huggingface.co/datasets/mtc/absinth_german_faithfulness_detection_dataset) to predict for a given German news article and sentence a label indicating whether the sentence is faithful to the article or not.
11
+
12
+ ## Instruction format
13
+
14
+ This format must be strictly respected, otherwise the model will generate sub-optimal outputs.
15
+
16
+ The template used to build a prompt for the Instruct model is defined as follows:
17
+ ```
18
+ ### Anweisung:
19
+ Analysiere ob der gegebene Satz dem Artikel treu ist. Wenn der Satz ausschließlich Informationen wiedergibt, die direkt aus dem Artikel stammen, ohne jegliche Ergänzungen oder Weglassungen, antworte mit 'Faithful'. Wenn der Satz Informationen enthält, die im direkten Widerspruch zum Artikel stehen, antworte mit 'Intrinsic Hallucination'. Wenn der Satz Informationen oder Details einführt, die im Artikel selbst nicht ausdrücklich erwähnt werden, antworte mit 'Extrinsic Hallucination'. Gib zuerst ein kurze Erklärung ob der Satz treu ist oder nicht und danach das entsprechende Label.
20
+ Artikel: {article}
21
+ Satz: {sentence}
22
+
23
+ ### Erklärung und Label:
24
+ ```
25
+ Paste into the template the desired article and the corresponding sentence. The model will output a short explanation followed by a label. For more information about the possible labels, see [here](https://huggingface.co/datasets/mtc/absinth_german_faithfulness_detection_dataset).
26
+
27
+ ## Installation
28
+
29
+ Install necessary packages. We recommend to install the [vllm](https://github.com/vllm-project/vllm) library, which speeds up evaluation considerably:
30
+
31
+ ```
32
+ pip3 install vllm
33
+ ```
34
+
35
+ ## Usage
36
+
37
+ ```python
38
+ from typing import List, Dict
39
+ import torch
40
+ from transformers import pipeline
41
+ from vllm import SamplingParams, LLM
42
+
43
+ def generate_prompts_for_generation(prompt_template: str, article: str, summary_sentences: List[str]) -> List[str]:
44
+ prompts = []
45
+ for sentence in summary_sentences:
46
+ prompts.append(prompt_template.format(article=article, sentence=sentence))
47
+ return prompts
48
+
49
+ def predict_with_vllm(prompts: List[str], model_name: str, max_context_length: int = 4096, max_gen_length: int = 256,
50
+ quantization: str = None):
51
+ sampling_params = SamplingParams(max_tokens=max_gen_length, skip_special_tokens=True, temperature=0.0)
52
+
53
+ llm = LLM(model=model_name, max_model_len=max_context_length, quantization=quantization)
54
+ completions = llm.generate(prompts, sampling_params) # Batch inference
55
+ predictions = [output.text for completion in completions for output in completion.outputs]
56
+ return predictions
57
+
58
+ def main():
59
+
60
+ model_name = "mtc/LeoLM-leo-mistral-hessianai-7b-classification-with-mixtral-explanation-3-epochs-finetuned-AWQ"
61
+ # Prompts longer than 4096 tokens will be truncated
62
+ max_context_length = 4096
63
+
64
+ article = "Ein neuer Zirkus ist gestern in Zürich angekommen. Viele Familien besuchten das große Zelt, um die Vorstellung zu sehen. Es gab Akrobaten, Clowns und Tiere, die das Publikum begeisterten. Der Zirkus bleibt noch eine Woche in der Stadt und bietet täglich Vorstellungen an."
65
+
66
+ summary_sentences = [
67
+ "Ein Zirkus ist in Basel angekommen.",
68
+ "Der Zirkus, der in 1950 gegründet wurde, wird von vielen Familien besucht."]
69
+
70
+ prompt_template = """### Anweisung:
71
+ Analysiere ob der gegebene Satz dem Artikel treu ist. Wenn der Satz ausschließlich Informationen wiedergibt, die direkt aus dem Artikel stammen, ohne jegliche Ergänzungen oder Weglassungen, antworte mit 'Faithful'. Wenn der Satz Informationen enthält, die im direkten Widerspruch zum Artikel stehen, antworte mit 'Intrinsic Hallucination'. Wenn der Satz Informationen oder Details einführt, die im Artikel selbst nicht ausdrücklich erwähnt werden, antworte mit 'Extrinsic Hallucination'. Gib zuerst ein kurze Erklärung ob der Satz treu ist oder nicht und danach das entsprechende Label.
72
+ Artikel: {article}
73
+ Satz: {sentence}
74
+
75
+ ### Erklärung und Label:"""
76
+
77
+
78
+ max_gen_length = 256
79
+ predictions = predict_with_vllm(prompts=prompts, model_name=model_name, max_context_length=max_context_length,
80
+ max_gen_length=max_gen_length, quantization="AWQ")
81
+ print(predictions)
82
+
83
+ ```
84
+
85
+ The output should have the following format, when executing the code above:
86
+
87
+ ```
88
+ ['\nErklärung:Der Satz ist falsch, da der Artikel über einen Zirkus in Zürich spricht, nicht in Basel.\nLabel:Intrinsic Hallucination',
89
+ '\nErklärung:Der Satz ist nicht im Artikel enthalten. Es wird zwar erwähnt, dass der Zirkus viele Familien besucht, aber nicht, dass er 1950 gegründet wurde.\nLabel:Extrinsic Hallucination']
90
+
91
+ ```
92
+
93
+
94
+ ## Training procedure
95
+
96
+ The model was finetuned using qlora with 4bit quantization on a A100-80Gb Gpu.
97
+ The following `bitsandbytes` quantization config was used during training:
98
+ - quant_method: QuantizationMethod.BITS_AND_BYTES
99
+ - load_in_8bit: False
100
+ - load_in_4bit: True
101
+ - llm_int8_threshold: 6.0
102
+ - llm_int8_skip_modules: None
103
+ - llm_int8_enable_fp32_cpu_offload: False
104
+ - llm_int8_has_fp16_weight: False
105
+ - bnb_4bit_quant_type: nf4
106
+ - bnb_4bit_use_double_quant: True
107
+ - bnb_4bit_compute_dtype: bfloat16
108
+
109
+ ### Framework versions
110
+
111
+ - PEFT 0.5.0
112
+
113
+ ## Quantization
114
+
115
+ - Activation-aware Weight Quantization ([AWQ](https://github.com/mit-han-lab/llm-awq))