gayanin
/

pubmed-abs-sub-03

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [facebook/bart-base](https://huggingface.co/facebook/bart-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1963
 ## Model description
@@ -35,8 +35,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
-- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -45,27 +45,41 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| 0.4453        | 0.21  | 500  | 0.3989          |
-| 0.3803        | 0.43  | 1000 | 0.3145          |
-| 0.3093        | 0.64  | 1500 | 0.2789          |
-| 0.3014        | 0.86  | 2000 | 0.2489          |
-| 0.251         | 1.07  | 2500 | 0.2404          |
-| 0.2304        | 1.28  | 3000 | 0.2312          |
-| 0.2248        | 1.5   | 3500 | 0.2185          |
-| 0.1944        | 1.71  | 4000 | 0.2134          |
-| 0.1961        | 1.93  | 4500 | 0.2066          |
-| 0.17          | 2.14  | 5000 | 0.2062          |
-| 0.1606        | 2.35  | 5500 | 0.2021          |
-| 0.1678        | 2.57  | 6000 | 0.1987          |
-| 0.1535        | 2.78  | 6500 | 0.1978          |
-| 0.1714        | 3.0   | 7000 | 0.1963          |
 ### Framework versions
-- Transformers 4.33.3
-- Pytorch 2.0.1
-- Datasets 2.14.5
-- Tokenizers 0.13.3

 This model is a fine-tuned version of [facebook/bart-base](https://huggingface.co/facebook/bart-base) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1905
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss |
+|:-------------:|:-----:|:-----:|:---------------:|
+| 0.53          | 0.11  | 500   | 0.4647          |
+| 0.4464        | 0.21  | 1000  | 0.3745          |
+| 0.4506        | 0.32  | 1500  | 0.3262          |
+| 0.3944        | 0.43  | 2000  | 0.3019          |
+| 0.3538        | 0.54  | 2500  | 0.2816          |
+| 0.2626        | 0.64  | 3000  | 0.2692          |
+| 0.2607        | 0.75  | 3500  | 0.2540          |
+| 0.2967        | 0.86  | 4000  | 0.2357          |
+| 0.2716        | 0.96  | 4500  | 0.2334          |
+| 0.2065        | 1.07  | 5000  | 0.2286          |
+| 0.19          | 1.18  | 5500  | 0.2271          |
+| 0.1976        | 1.28  | 6000  | 0.2247          |
+| 0.2223        | 1.39  | 6500  | 0.2164          |
+| 0.2229        | 1.5   | 7000  | 0.2123          |
+| 0.2018        | 1.61  | 7500  | 0.2106          |
+| 0.1857        | 1.71  | 8000  | 0.2037          |
+| 0.22          | 1.82  | 8500  | 0.2033          |
+| 0.1793        | 1.93  | 9000  | 0.1993          |
+| 0.1441        | 2.03  | 9500  | 0.2012          |
+| 0.1515        | 2.14  | 10000 | 0.2011          |
+| 0.1412        | 2.25  | 10500 | 0.2023          |
+| 0.1505        | 2.35  | 11000 | 0.1978          |
+| 0.1472        | 2.46  | 11500 | 0.1961          |
+| 0.1526        | 2.57  | 12000 | 0.1916          |
+| 0.1454        | 2.68  | 12500 | 0.1919          |
+| 0.1011        | 2.78  | 13000 | 0.1920          |
+| 0.1386        | 2.89  | 13500 | 0.1915          |
+| 0.1368        | 3.0   | 14000 | 0.1905          |
 ### Framework versions
+- Transformers 4.34.1
+- Pytorch 2.1.0
+- Datasets 2.14.6
+- Tokenizers 0.14.1

generation_config.json CHANGED Viewed

@@ -9,5 +9,5 @@
   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
-  "transformers_version": "4.33.3"
 }

   "no_repeat_ngram_size": 3,
   "num_beams": 4,
   "pad_token_id": 1,
+  "transformers_version": "4.34.1"
 }