teddy-f-47 commited on
Commit
6032eb5
1 Parent(s): 1b49982

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +28 -0
README.md CHANGED
@@ -23,6 +23,34 @@ The model was trained for a context length of 1024 tokens.
23
 
24
  The model is intended for research purposes only. It may generate fictitious, incorrect, unethical, or biased texts. At its current state, it is not suitable for production purposes.
25
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
26
  ## Training and evaluation data
27
 
28
  The 20231201 Polish Wikipedia dump.
 
23
 
24
  The model is intended for research purposes only. It may generate fictitious, incorrect, unethical, or biased texts. At its current state, it is not suitable for production purposes.
25
 
26
+ Example:
27
+ ```
28
+ tokenizer = AutoTokenizer.from_pretrained(
29
+ model_name, trust_remote_code=True, use_fast=True
30
+ )
31
+ # to use flash_attention_2, may need to load the original microsoft phi-1.5 and load weights from this model
32
+ model = AutoModelForCausalLM.from_pretrained(
33
+ model_name, vocab_size=len(tokenizer), # attn_implementation="flash_attention_2",
34
+ trust_remote_code=True, torch_dtype=torch.bfloat16
35
+ ).to(torch.device('cuda'))
36
+ model.eval()
37
+
38
+ generation_config = GenerationConfig.from_pretrained(
39
+ model_name, do_sample=False, repetition_penalty=1.5,
40
+ min_new_tokens=1, max_new_tokens=128
41
+ )
42
+
43
+ test_input = tokenizer("Wrocław to polski miasto. Wrocław jest ", return_tensors='pt').to(torch.device('cuda'))
44
+ test_output = model.generate(**test_input, generation_config=generation_config)
45
+ test_preds = tokenizer.batch_decode(sequences=test_output, skip_special_tokens=True, clean_up_tokenization_spaces=True)
46
+ print(test_preds)
47
+ ```
48
+
49
+ Output:
50
+ ```
51
+ ['Wrocław to polski miasto. Wrocław jest stolicą województwa dolnośląskiego, a także siedzibą władz powiatu wrocławskiego i gminy miejsko-wiejskiej Wrocław\n\nMiasto leży w południowo–zachodniej części Dolnego Śląska na Przedgórzu Sudeckim nad rzeką Odrą (odnoga Odry). Przez miasto przebiega droga krajowa nr 94 łącząca Berlin z Wrocławiem oraz linia kolejowa do Wrocławia Głównego przez Wrocław Główny – Kłodzko Główne/Szczecin Zachodni - Legnica. Miasto posiada połączenie kolejowe ze stacją kolejową Wrocław Gądów Mały lub Gądowem Małym poprzez węzeł kolejowy Wrocław Gądów Wielki. W mieście znajduje się stacja towarowa Wrocław Gądów Mały.\nW latach 1975−1998 miejscowość administracyjnie należała do woj. wałbrzyskiego. Od 1']
52
+ ```
53
+
54
  ## Training and evaluation data
55
 
56
  The 20231201 Polish Wikipedia dump.