End of training

Browse files

Files changed (3) hide show

README.md +53 -53
model.safetensors +1 -1
runs/Feb27_18-53-22_Software-AI/events.out.tfevents.1709047403.Software-AI.597540.4 +2 -2

README.md CHANGED Viewed

@@ -36,7 +36,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.00025
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
@@ -46,58 +46,58 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step  | Validation Loss |
-|:-------------:|:-----:|:-----:|:---------------:|
-| 4.8302        | 1.0   | 201   | 4.7698          |
-| 4.8334        | 2.0   | 402   | 4.7698          |
-| 4.83          | 3.0   | 603   | 4.7698          |
-| 4.8325        | 4.0   | 804   | 4.7698          |
-| 4.8774        | 5.0   | 1005  | 4.7698          |
-| 4.8289        | 6.0   | 1206  | 4.7698          |
-| 4.831         | 7.0   | 1407  | 4.7698          |
-| 4.8365        | 8.0   | 1608  | 4.7698          |
-| 4.8342        | 9.0   | 1809  | 4.7698          |
-| 4.8348        | 10.0  | 2010  | 4.7698          |
-| 4.8334        | 11.0  | 2211  | 4.7698          |
-| 4.8329        | 12.0  | 2412  | 4.7698          |
-| 4.8308        | 13.0  | 2613  | 4.7698          |
-| 4.8314        | 14.0  | 2814  | 4.7698          |
-| 4.8345        | 15.0  | 3015  | 4.7698          |
-| 4.8299        | 16.0  | 3216  | 4.7698          |
-| 4.8319        | 17.0  | 3417  | 4.7698          |
-| 4.8336        | 18.0  | 3618  | 4.7698          |
-| 4.8359        | 19.0  | 3819  | 4.7698          |
-| 4.835         | 20.0  | 4020  | 4.7698          |
-| 4.8319        | 21.0  | 4221  | 4.7698          |
-| 4.828         | 22.0  | 4422  | 4.7698          |
-| 4.8317        | 23.0  | 4623  | 4.7698          |
-| 4.8322        | 24.0  | 4824  | 4.7698          |
-| 4.8371        | 25.0  | 5025  | 4.7698          |
-| 4.8339        | 26.0  | 5226  | 4.7698          |
-| 4.8336        | 27.0  | 5427  | 4.7698          |
-| 4.8332        | 28.0  | 5628  | 4.7698          |
-| 4.8351        | 29.0  | 5829  | 4.7698          |
-| 4.8299        | 30.0  | 6030  | 4.7698          |
-| 4.8319        | 31.0  | 6231  | 4.7698          |
-| 4.8329        | 32.0  | 6432  | 4.7698          |
-| 4.8358        | 33.0  | 6633  | 4.7698          |
-| 4.8275        | 34.0  | 6834  | 4.7698          |
-| 4.8316        | 35.0  | 7035  | 4.7698          |
-| 4.8343        | 36.0  | 7236  | 4.7698          |
-| 4.8267        | 37.0  | 7437  | 4.7698          |
-| 4.8335        | 38.0  | 7638  | 4.7698          |
-| 4.8354        | 39.0  | 7839  | 4.7698          |
-| 4.834         | 40.0  | 8040  | 4.7698          |
-| 4.832         | 41.0  | 8241  | 4.7698          |
-| 4.8344        | 42.0  | 8442  | 4.7698          |
-| 4.829         | 43.0  | 8643  | 4.7698          |
-| 4.8359        | 44.0  | 8844  | 4.7698          |
-| 4.8337        | 45.0  | 9045  | 4.7698          |
-| 4.8294        | 46.0  | 9246  | 4.7698          |
-| 4.8287        | 47.0  | 9447  | 4.7698          |
-| 4.8308        | 48.0  | 9648  | 4.7698          |
-| 4.8283        | 49.0  | 9849  | 4.7698          |
-| 4.8333        | 50.0  | 10050 | 4.7698          |
 ### Framework versions

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.000125
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 4.8143        | 1.0   | 86   | 4.7698          |
+| 4.8248        | 2.0   | 172  | 4.7698          |
+| 4.8228        | 3.0   | 258  | 4.7698          |
+| 4.8278        | 4.0   | 344  | 4.7698          |
+| 4.8267        | 5.0   | 430  | 4.7698          |
+| 4.8273        | 6.0   | 516  | 4.7698          |
+| 4.8258        | 7.0   | 602  | 4.7698          |
+| 4.83          | 8.0   | 688  | 4.7698          |
+| 4.8212        | 9.0   | 774  | 4.7698          |
+| 4.8206        | 10.0  | 860  | 4.7698          |
+| 4.8208        | 11.0  | 946  | 4.7698          |
+| 4.8242        | 12.0  | 1032 | 4.7698          |
+| 4.8242        | 13.0  | 1118 | 4.7698          |
+| 4.8249        | 14.0  | 1204 | 4.7698          |
+| 4.8255        | 15.0  | 1290 | 4.7698          |
+| 4.8246        | 16.0  | 1376 | 4.7698          |
+| 4.8238        | 17.0  | 1462 | 4.7698          |
+| 4.8254        | 18.0  | 1548 | 4.7698          |
+| 4.8278        | 19.0  | 1634 | 4.7698          |
+| 4.827         | 20.0  | 1720 | 4.7698          |
+| 4.829         | 21.0  | 1806 | 4.7698          |
+| 4.8231        | 22.0  | 1892 | 4.7698          |
+| 4.8312        | 23.0  | 1978 | 4.7698          |
+| 4.8274        | 24.0  | 2064 | 4.7698          |
+| 4.8272        | 25.0  | 2150 | 4.7698          |
+| 4.8288        | 26.0  | 2236 | 4.7698          |
+| 4.8273        | 27.0  | 2322 | 4.7698          |
+| 4.8271        | 28.0  | 2408 | 4.7698          |
+| 4.8297        | 29.0  | 2494 | 4.7698          |
+| 4.8312        | 30.0  | 2580 | 4.7698          |
+| 4.8274        | 31.0  | 2666 | 4.7698          |
+| 4.829         | 32.0  | 2752 | 4.7698          |
+| 4.8264        | 33.0  | 2838 | 4.7698          |
+| 4.8286        | 34.0  | 2924 | 4.7698          |
+| 4.8277        | 35.0  | 3010 | 4.7698          |
+| 4.8322        | 36.0  | 3096 | 4.7698          |
+| 4.8277        | 37.0  | 3182 | 4.7698          |
+| 4.8292        | 38.0  | 3268 | 4.7698          |
+| 4.8267        | 39.0  | 3354 | 4.7698          |
+| 4.8302        | 40.0  | 3440 | 4.7698          |
+| 4.8336        | 41.0  | 3526 | 4.7698          |
+| 4.829         | 42.0  | 3612 | 4.7698          |
+| 4.8273        | 43.0  | 3698 | 4.7698          |
+| 4.8321        | 44.0  | 3784 | 4.7698          |
+| 4.8315        | 45.0  | 3870 | 4.7698          |
+| 4.8268        | 46.0  | 3956 | 4.7698          |
+| 4.8327        | 47.0  | 4042 | 4.7698          |
+| 4.8333        | 48.0  | 4128 | 4.7698          |
+| 4.8313        | 49.0  | 4214 | 4.7698          |
+| 4.8275        | 50.0  | 4300 | 4.7698          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:12e94c500239960806746b917d244184b7f5c29d94fd0309e4d0d4d09701d318
 size 1112905680

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb2fc1464b756afd094c7bd369d5513e620930dabfa0d76f0510ce8342bc8fd9
 size 1112905680

runs/Feb27_18-53-22_Software-AI/events.out.tfevents.1709047403.Software-AI.597540.4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a5eb101b1a2aec81c13c6b5459bf964ffe6ddfe88515e3ad7abe6ac5400f54b
-size 23734

 version https://git-lfs.github.com/spec/v1
+oid sha256:f44ddac6d6f75e277300a08a6f510431506973233e44abc91a1e397094017ef2
+size 30936