End of training

Browse files

Files changed (4) hide show

README.md +102 -102
model.safetensors +1 -1
runs/Mar06_09-18-30_Software-AI/events.out.tfevents.1709704110.Software-AI.118212.6 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [makhataei/qa-persian-albert-fa-zwnj-base-v2](https://huggingface.co/makhataei/qa-persian-albert-fa-zwnj-base-v2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 5.9904
 ## Model description
@@ -34,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 3.125e-09
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
@@ -46,106 +46,106 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 6.1055        | 1.0   | 9    | 6.0314          |
-| 6.2159        | 2.0   | 18   | 6.0304          |
-| 6.1915        | 3.0   | 27   | 6.0294          |
-| 6.2935        | 4.0   | 36   | 6.0284          |
-| 6.1699        | 5.0   | 45   | 6.0274          |
-| 6.0742        | 6.0   | 54   | 6.0265          |
-| 6.2307        | 7.0   | 63   | 6.0256          |
-| 6.1558        | 8.0   | 72   | 6.0247          |
-| 6.0157        | 9.0   | 81   | 6.0237          |
-| 6.116         | 10.0  | 90   | 6.0228          |
-| 6.0716        | 11.0  | 99   | 6.0219          |
-| 6.0648        | 12.0  | 108  | 6.0211          |
-| 6.1447        | 13.0  | 117  | 6.0202          |
-| 6.2211        | 14.0  | 126  | 6.0194          |
-| 6.1377        | 15.0  | 135  | 6.0186          |
-| 6.1555        | 16.0  | 144  | 6.0177          |
-| 6.1721        | 17.0  | 153  | 6.0169          |
-| 6.0705        | 18.0  | 162  | 6.0161          |
-| 6.1123        | 19.0  | 171  | 6.0153          |
-| 6.0666        | 20.0  | 180  | 6.0146          |
-| 6.1354        | 21.0  | 189  | 6.0139          |
-| 6.1009        | 22.0  | 198  | 6.0131          |
-| 6.1329        | 23.0  | 207  | 6.0124          |
-| 6.1489        | 24.0  | 216  | 6.0117          |
-| 6.1173        | 25.0  | 225  | 6.0110          |
-| 6.1406        | 26.0  | 234  | 6.0103          |
-| 6.1318        | 27.0  | 243  | 6.0096          |
-| 6.1056        | 28.0  | 252  | 6.0090          |
-| 6.1461        | 29.0  | 261  | 6.0083          |
-| 6.1155        | 30.0  | 270  | 6.0077          |
-| 6.2015        | 31.0  | 279  | 6.0071          |
-| 6.2012        | 32.0  | 288  | 6.0065          |
-| 6.0812        | 33.0  | 297  | 6.0059          |
-| 6.1132        | 34.0  | 306  | 6.0053          |
-| 6.3608        | 35.0  | 315  | 6.0047          |
-| 6.5492        | 36.0  | 324  | 6.0042          |
-| 6.1924        | 37.0  | 333  | 6.0036          |
-| 6.075         | 38.0  | 342  | 6.0031          |
-| 6.0452        | 39.0  | 351  | 6.0026          |
-| 6.2926        | 40.0  | 360  | 6.0021          |
-| 6.2101        | 41.0  | 369  | 6.0016          |
-| 6.1133        | 42.0  | 378  | 6.0011          |
-| 6.5868        | 43.0  | 387  | 6.0007          |
-| 6.0404        | 44.0  | 396  | 6.0002          |
-| 6.1184        | 45.0  | 405  | 5.9998          |
-| 6.1509        | 46.0  | 414  | 5.9993          |
-| 6.1076        | 47.0  | 423  | 5.9989          |
-| 6.4131        | 48.0  | 432  | 5.9985          |
-| 6.2086        | 49.0  | 441  | 5.9981          |
-| 6.2167        | 50.0  | 450  | 5.9977          |
-| 6.3881        | 51.0  | 459  | 5.9973          |
-| 6.1252        | 52.0  | 468  | 5.9969          |
-| 6.0959        | 53.0  | 477  | 5.9965          |
-| 6.1298        | 54.0  | 486  | 5.9962          |
-| 6.0927        | 55.0  | 495  | 5.9958          |
-| 6.3951        | 56.0  | 504  | 5.9955          |
-| 6.1064        | 57.0  | 513  | 5.9952          |
-| 6.0339        | 58.0  | 522  | 5.9948          |
-| 6.1585        | 59.0  | 531  | 5.9945          |
-| 6.1069        | 60.0  | 540  | 5.9942          |
-| 6.0759        | 61.0  | 549  | 5.9940          |
-| 6.1741        | 62.0  | 558  | 5.9937          |
-| 6.129         | 63.0  | 567  | 5.9934          |
-| 6.0907        | 64.0  | 576  | 5.9932          |
-| 6.0194        | 65.0  | 585  | 5.9930          |
-| 6.2036        | 66.0  | 594  | 5.9928          |
-| 6.1617        | 67.0  | 603  | 5.9926          |
-| 6.101         | 68.0  | 612  | 5.9924          |
-| 6.4511        | 69.0  | 621  | 5.9923          |
-| 6.1066        | 70.0  | 630  | 5.9921          |
-| 6.6108        | 71.0  | 639  | 5.9920          |
-| 6.3935        | 72.0  | 648  | 5.9918          |
-| 6.2353        | 73.0  | 657  | 5.9917          |
-| 6.1805        | 74.0  | 666  | 5.9916          |
-| 6.7511        | 75.0  | 675  | 5.9914          |
-| 6.0411        | 76.0  | 684  | 5.9913          |
-| 6.1167        | 77.0  | 693  | 5.9912          |
-| 6.0171        | 78.0  | 702  | 5.9911          |
-| 6.0676        | 79.0  | 711  | 5.9910          |
-| 6.3753        | 80.0  | 720  | 5.9909          |
-| 6.4313        | 81.0  | 729  | 5.9909          |
-| 6.1138        | 82.0  | 738  | 5.9908          |
-| 6.0061        | 83.0  | 747  | 5.9907          |
-| 6.2253        | 84.0  | 756  | 5.9907          |
-| 6.0958        | 85.0  | 765  | 5.9906          |
-| 6.0317        | 86.0  | 774  | 5.9906          |
-| 6.2861        | 87.0  | 783  | 5.9906          |
-| 6.1514        | 88.0  | 792  | 5.9905          |
-| 6.1061        | 89.0  | 801  | 5.9905          |
-| 6.091         | 90.0  | 810  | 5.9905          |
-| 6.0333        | 91.0  | 819  | 5.9905          |
-| 6.0537        | 92.0  | 828  | 5.9905          |
-| 6.157         | 93.0  | 837  | 5.9904          |
-| 6.234         | 94.0  | 846  | 5.9904          |
-| 6.1004        | 95.0  | 855  | 5.9904          |
-| 6.1025        | 96.0  | 864  | 5.9904          |
-| 6.4046        | 97.0  | 873  | 5.9904          |
-| 6.1262        | 98.0  | 882  | 5.9904          |
-| 6.0312        | 99.0  | 891  | 5.9904          |
-| 6.2181        | 100.0 | 900  | 5.9904          |
 ### Framework versions

 This model is a fine-tuned version of [makhataei/qa-persian-albert-fa-zwnj-base-v2](https://huggingface.co/makhataei/qa-persian-albert-fa-zwnj-base-v2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 5.9760
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1.5625e-09
 - train_batch_size: 14
 - eval_batch_size: 14
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 6.0676        | 1.0   | 9    | 5.9900          |
+| 6.171         | 2.0   | 18   | 5.9896          |
+| 6.1535        | 3.0   | 27   | 5.9892          |
+| 6.2515        | 4.0   | 36   | 5.9889          |
+| 6.1346        | 5.0   | 45   | 5.9885          |
+| 6.0391        | 6.0   | 54   | 5.9881          |
+| 6.1889        | 7.0   | 63   | 5.9878          |
+| 6.1206        | 8.0   | 72   | 5.9874          |
+| 5.9824        | 9.0   | 81   | 5.9871          |
+| 6.082         | 10.0  | 90   | 5.9867          |
+| 6.0392        | 11.0  | 99   | 5.9864          |
+| 6.0331        | 12.0  | 108  | 5.9860          |
+| 6.1102        | 13.0  | 117  | 5.9857          |
+| 6.1877        | 14.0  | 126  | 5.9854          |
+| 6.1048        | 15.0  | 135  | 5.9851          |
+| 6.125         | 16.0  | 144  | 5.9848          |
+| 6.142         | 17.0  | 153  | 5.9845          |
+| 6.0412        | 18.0  | 162  | 5.9842          |
+| 6.084         | 19.0  | 171  | 5.9839          |
+| 6.0388        | 20.0  | 180  | 5.9836          |
+| 6.1073        | 21.0  | 189  | 5.9834          |
+| 6.0735        | 22.0  | 198  | 5.9831          |
+| 6.1057        | 23.0  | 207  | 5.9828          |
+| 6.1227        | 24.0  | 216  | 5.9825          |
+| 6.0885        | 25.0  | 225  | 5.9823          |
+| 6.1121        | 26.0  | 234  | 5.9820          |
+| 6.1067        | 27.0  | 243  | 5.9818          |
+| 6.0809        | 28.0  | 252  | 5.9816          |
+| 6.1209        | 29.0  | 261  | 5.9814          |
+| 6.091         | 30.0  | 270  | 5.9811          |
+| 6.174         | 31.0  | 279  | 5.9809          |
+| 6.1738        | 32.0  | 288  | 5.9807          |
+| 6.0578        | 33.0  | 297  | 5.9805          |
+| 6.088         | 34.0  | 306  | 5.9803          |
+| 6.3337        | 35.0  | 315  | 5.9802          |
+| 6.5208        | 36.0  | 324  | 5.9800          |
+| 6.1701        | 37.0  | 333  | 5.9798          |
+| 6.0536        | 38.0  | 342  | 5.9796          |
+| 6.0241        | 39.0  | 351  | 5.9795          |
+| 6.2651        | 40.0  | 360  | 5.9793          |
+| 6.1886        | 41.0  | 369  | 5.9792          |
+| 6.093         | 42.0  | 378  | 5.9791          |
+| 6.5572        | 43.0  | 387  | 5.9789          |
+| 6.0211        | 44.0  | 396  | 5.9788          |
+| 6.099         | 45.0  | 405  | 5.9787          |
+| 6.1318        | 46.0  | 414  | 5.9785          |
+| 6.0889        | 47.0  | 423  | 5.9784          |
+| 6.3882        | 48.0  | 432  | 5.9783          |
+| 6.187         | 49.0  | 441  | 5.9782          |
+| 6.1951        | 50.0  | 450  | 5.9781          |
+| 6.3676        | 51.0  | 459  | 5.9779          |
+| 6.1077        | 52.0  | 468  | 5.9778          |
+| 6.0784        | 53.0  | 477  | 5.9777          |
+| 6.11          | 54.0  | 486  | 5.9776          |
+| 6.0748        | 55.0  | 495  | 5.9775          |
+| 6.3748        | 56.0  | 504  | 5.9774          |
+| 6.0896        | 57.0  | 513  | 5.9773          |
+| 6.0178        | 58.0  | 522  | 5.9772          |
+| 6.1414        | 59.0  | 531  | 5.9771          |
+| 6.0908        | 60.0  | 540  | 5.9771          |
+| 6.0607        | 61.0  | 549  | 5.9770          |
+| 6.1563        | 62.0  | 558  | 5.9769          |
+| 6.113         | 63.0  | 567  | 5.9768          |
+| 6.0753        | 64.0  | 576  | 5.9768          |
+| 6.0048        | 65.0  | 585  | 5.9767          |
+| 6.185         | 66.0  | 594  | 5.9767          |
+| 6.1447        | 67.0  | 603  | 5.9766          |
+| 6.0867        | 68.0  | 612  | 5.9766          |
+| 6.4344        | 69.0  | 621  | 5.9765          |
+| 6.0922        | 70.0  | 630  | 5.9765          |
+| 6.5894        | 71.0  | 639  | 5.9764          |
+| 6.3774        | 72.0  | 648  | 5.9764          |
+| 6.2187        | 73.0  | 657  | 5.9764          |
+| 6.1662        | 74.0  | 666  | 5.9763          |
+| 6.7302        | 75.0  | 675  | 5.9763          |
+| 6.0275        | 76.0  | 684  | 5.9763          |
+| 6.1029        | 77.0  | 693  | 5.9763          |
+| 6.0038        | 78.0  | 702  | 5.9762          |
+| 6.0541        | 79.0  | 711  | 5.9762          |
+| 6.3574        | 80.0  | 720  | 5.9762          |
+| 6.413         | 81.0  | 729  | 5.9762          |
+| 6.1006        | 82.0  | 738  | 5.9761          |
+| 5.9928        | 83.0  | 747  | 5.9761          |
+| 6.2083        | 84.0  | 756  | 5.9761          |
+| 6.0824        | 85.0  | 765  | 5.9761          |
+| 6.0185        | 86.0  | 774  | 5.9761          |
+| 6.2693        | 87.0  | 783  | 5.9761          |
+| 6.138         | 88.0  | 792  | 5.9761          |
+| 6.0924        | 89.0  | 801  | 5.9761          |
+| 6.0778        | 90.0  | 810  | 5.9761          |
+| 6.0203        | 91.0  | 819  | 5.9761          |
+| 6.0408        | 92.0  | 828  | 5.9761          |
+| 6.1429        | 93.0  | 837  | 5.9760          |
+| 6.2182        | 94.0  | 846  | 5.9760          |
+| 6.0875        | 95.0  | 855  | 5.9760          |
+| 6.088         | 96.0  | 864  | 5.9760          |
+| 6.39          | 97.0  | 873  | 5.9760          |
+| 6.1116        | 98.0  | 882  | 5.9760          |
+| 6.0184        | 99.0  | 891  | 5.9760          |
+| 6.203         | 100.0 | 900  | 5.9760          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0315244bdc22dd1827144099cbc2d603d8749642ec56885b02971f1775c8439e
 size 44381360

 version https://git-lfs.github.com/spec/v1
+oid sha256:2567f5c6d2e7bc6b9b76ab0b0f06432b8a6c1b4b4a8a8bf840768a4d196a7b4e
 size 44381360

runs/Mar06_09-18-30_Software-AI/events.out.tfevents.1709704110.Software-AI.118212.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:56b5df16f96a554332ee5439674bda2e7b3a18eb78b9f988a3f3dcac38c4d664
+size 47651

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea1a16743d7012dac916fcf6f47f4dc850f283b900e16eb825b5c3542379de68
 size 4219

 version https://git-lfs.github.com/spec/v1
+oid sha256:1c6028806b8372aac863340872f47c33579dd5371e660f48128af8752baf07c3
 size 4219