elmadany commited on
Commit
29eedb6
1 Parent(s): b208326

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +38 -20
README.md CHANGED
@@ -9,29 +9,47 @@ This is the repository accompanying our paper [AraT5: Text-to-Text Transformers
9
  ---
10
  # How to use AraT5 models
11
  Below is an example for fine-tuning **AraT5-base** for News Title Generation on the Aranews dataset
12
- ``` bash
13
- !python run_trainier_seq2seq_huggingface.py \
14
- --learning_rate 5e-5 \
15
- --max_target_length 128 --max_source_length 128 \
16
- --per_device_train_batch_size 8 --per_device_eval_batch_size 8 \
17
- --model_name_or_path "UBC-NLP/AraT5-base" \
18
- --output_dir "/content/AraT5_FT_title_generation" --overwrite_output_dir \
19
- --num_train_epochs 3 \
20
- --train_file "/content/ARGEn_title_genration_sample_train.tsv" \
21
- --validation_file "/content/ARGEn_title_genration_sample_valid.tsv" \
22
- --task "title_generation" --text_column "document" --summary_column "title" \
23
- --load_best_model_at_end --metric_for_best_model "eval_bleu" --greater_is_better True --evaluation_strategy epoch --logging_strategy epoch --predict_with_generate\
24
- --do_train --do_eval
 
 
 
 
 
 
 
 
 
 
 
25
  ```
26
- For more details about the fine-tuning example, please read this notebook [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://github.com/UBC-NLP/araT5/blob/main/examples/Fine_tuning_AraT5.ipynb)
27
-
28
- In addition, we release the fine-tuned checkpoint of the News Title Generation (NGT) which is described in the paper. The model available at Huggingface ([UBC-NLP/AraT5-base-title-generation](https://huggingface.co/UBC-NLP/AraT5-base-title-generation)).
29
-
30
- For more details, please visit our own [GitHub](https://github.com/UBC-NLP/araT5).
31
-
32
-
33
 
 
 
 
 
 
34
 
 
 
 
 
 
 
 
 
35
 
36
  # AraT5 Models Checkpoints
37
 
 
9
  ---
10
  # How to use AraT5 models
11
  Below is an example for fine-tuning **AraT5-base** for News Title Generation on the Aranews dataset
12
+ ```python
13
+ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
14
+ tokenizer = AutoTokenizer.from_pretrained("UBC-NLP/AraT5-base-title-generation")
15
+ model = AutoModelForSeq2SeqLM.from_pretrained("UBC-NLP/AraT5-base-title-generation")
16
+
17
+ Document = "تحت رعاية صاحب السمو الملكي الأمير سعود بن نايف بن عبدالعزيز أمير المنطقة الشرقية اختتمت غرفة الشرقية مؤخرا، الثاني من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة ضمن مبادرتها المجانية للعام 2019 حيث قدمت 6 برامج تدريبية نوعية. وثمن رئيس مجلس إدارة الغرفة، عبدالحكيم العمار الخالدي، رعاية سمو أمير المنطقة الشرقية للمبادرة، مؤكدا أن دعم سموه لجميع أنشطة ."
18
+
19
+ encoding = tokenizer.encode_plus(Document,pad_to_max_length=True, return_tensors="pt")
20
+ input_ids, attention_masks = encoding["input_ids"], encoding["attention_mask"]
21
+
22
+
23
+ outputs = model.generate(
24
+ input_ids=input_ids, attention_mask=attention_masks,
25
+ max_length=256,
26
+ do_sample=True,
27
+ top_k=120,
28
+ top_p=0.95,
29
+ early_stopping=True,
30
+ num_return_sequences=5
31
+ )
32
+
33
+ for id, output in enumerate(outputs):
34
+ title = tokenizer.decode(output, skip_special_tokens=True,clean_up_tokenization_spaces=True)
35
+ print("title#"+str(id), title)
36
  ```
37
+ **The input news document**
 
 
 
 
 
 
38
 
39
+ <div style="white-space : pre-wrap !important;word-break: break-word; direction:rtl; text-align: right">
40
+ تحت رعاية صاحب السمو الملكي الأمير سعود بن نايف بن عبدالعزيز أمير المنطقة الشرقية اختتمت غرفة الشرقية مؤخرا، الثاني من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة ضمن مبادرتها المجانية للعام 2019 حيث قدمت 6 برامج تدريبية نوعية. وثمن رئيس مجلس إدارة الغرفة، عبدالحكيم العمار الخالدي، رعاية سمو أمير المنطقة الشرقية للمبادرة، مؤكدا أن دعم سموه لجميع أنشطة .
41
+ <br>
42
+ </div>
43
+
44
 
45
+ **The generated titles**
46
+ ```
47
+ title#0 غرفة الشرقية تختتم المرحلة الثانية من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة
48
+ title#1 غرفة الشرقية تختتم الثاني من مبادرة تأهيل وتأهيل أبناء وبناتنا
49
+ title#2 سعود بن نايف يختتم ثانى مبادراتها لتأهيل وتدريب أبناء وبنات المملكة
50
+ title#3 أمير الشرقية يرعى اختتام برنامج برنامج تدريب أبناء وبنات المملكة
51
+ title#4 سعود بن نايف يرعى اختتام مبادرة تأهيل وتدريب أبناء وبنات المملكة
52
+ ```
53
 
54
  # AraT5 Models Checkpoints
55