End of training

Browse files

Files changed (7) hide show

README.md +18 -15
config.json +1 -1
generation_config.json +1 -1
logs/events.out.tfevents.1712421956.b1e8a351e6f5.2690.0 +3 -0
logs/events.out.tfevents.1712430589.b1e8a351e6f5.2690.1 +3 -0
model.safetensors +1 -1
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.1782
-- Rouge1: 51.8379
-- Rouge2: 41.3714
-- Rougel: 51.9665
-- Rougelsum: 51.9518
-- Gen Len: 6.8067
 ## Model description
@@ -42,27 +42,30 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
-| 1.2491        | 1.0   | 3079  | 1.2203          | 51.123  | 40.4019 | 51.1098 | 51.1009   | 6.8389  |
-| 1.0688        | 2.0   | 6158  | 1.1890          | 50.7818 | 40.0174 | 50.827  | 50.8336   | 6.7285  |
-| 1.0126        | 3.0   | 9237  | 1.1782          | 51.8379 | 41.3714 | 51.9665 | 51.9518   | 6.8067  |
-| 0.9778        | 4.0   | 12316 | 1.1825          | 51.1751 | 40.5841 | 51.231  | 51.254    | 6.8103  |
-| 0.9071        | 5.0   | 15395 | 1.1858          | 51.0503 | 40.212  | 51.1279 | 51.1203   | 6.7655  |
 ### Framework versions
-- Transformers 4.39.1
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [t5-small](https://huggingface.co/t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.1390
+- Rouge1: 51.5946
+- Rouge2: 41.2028
+- Rougel: 51.4341
+- Rougelsum: 51.4546
+- Gen Len: 6.3538
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 4
+- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 8
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len |
 |:-------------:|:-----:|:-----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:-------:|
+| 1.2197        | 1.0   | 6157  | 1.1987          | 51.1834 | 39.9631 | 51.1841 | 51.1643   | 6.7607  |
+| 0.9954        | 2.0   | 12314 | 1.1706          | 50.7977 | 39.619  | 50.6689 | 50.6616   | 6.3795  |
+| 0.9489        | 3.0   | 18471 | 1.1442          | 52.3555 | 42.2113 | 52.2724 | 52.2803   | 6.3484  |
+| 0.8887        | 4.0   | 24628 | 1.1390          | 51.5946 | 41.2028 | 51.4341 | 51.4546   | 6.3538  |
+| 0.8414        | 5.0   | 30785 | 1.1799          | 51.9184 | 41.1821 | 51.8954 | 51.8789   | 6.7852  |
+| 0.753         | 6.0   | 36942 | 1.1829          | 52.4824 | 41.3235 | 52.3505 | 52.3882   | 6.6134  |
+| 0.7471        | 7.0   | 43099 | 1.1995          | 51.3876 | 40.6408 | 51.2487 | 51.277    | 6.6271  |
+| 0.7327        | 8.0   | 49256 | 1.2001          | 51.6537 | 40.8793 | 51.4822 | 51.542    | 6.6366  |
 ### Framework versions
+- Transformers 4.39.3
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -55,7 +55,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.39.1",
   "use_cache": true,
   "vocab_size": 32128
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
   "use_cache": true,
   "vocab_size": 32128
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.39.1"
 }

   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.39.3"
 }

logs/events.out.tfevents.1712421956.b1e8a351e6f5.2690.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0d89235cd37c61adddf72e34a9acce02d0e0031f4b1800f9fa412353d2f7248
+size 31149

logs/events.out.tfevents.1712430589.b1e8a351e6f5.2690.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d32707287bd7e00b4bf3f84f584d68f9d6d510716fff74052801594176f5b7c
+size 623

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbc941780c1eb67ee8d56ecfed13a9e596e1a63d72e6c795942def2350495779
 size 242041896

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b426f41170cfbab622dc7cbe3b6803b4e963e77e09fb4fba281a0ed2f10298e
 size 242041896

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:18a17ffa43d6a3b803f7c11c5886425f454ea96a56abe0a08c0424f2255ce485
-size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:5e5542a5eb289ff823db5b69ae67317b55a06209885b4704093d051d47662273
+size 5112