Marcos12886 commited on Sep 10, 2024

Commit

2f8b8ec

verified ·

1 Parent(s): a0c9418

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +23 -19
checkpoint-121/model.safetensors +1 -1
checkpoint-121/optimizer.pt +1 -1
checkpoint-121/scheduler.pt +1 -1
checkpoint-121/trainer_state.json +43 -43
checkpoint-121/training_args.bin +1 -1
checkpoint-145/model.safetensors +1 -1
checkpoint-145/optimizer.pt +1 -1
checkpoint-145/scheduler.pt +1 -1
checkpoint-145/trainer_state.json +52 -52
checkpoint-145/training_args.bin +1 -1
checkpoint-169/model.safetensors +1 -1
checkpoint-169/optimizer.pt +1 -1
checkpoint-169/scheduler.pt +1 -1
checkpoint-169/trainer_state.json +59 -59
checkpoint-169/training_args.bin +1 -1
checkpoint-194/model.safetensors +1 -1
checkpoint-194/optimizer.pt +1 -1
checkpoint-194/scheduler.pt +1 -1
checkpoint-194/trainer_state.json +67 -67
checkpoint-194/training_args.bin +1 -1
checkpoint-218/model.safetensors +1 -1
checkpoint-218/optimizer.pt +1 -1
checkpoint-218/scheduler.pt +1 -1
checkpoint-218/trainer_state.json +75 -75
checkpoint-218/training_args.bin +1 -1
checkpoint-24/model.safetensors +1 -1
checkpoint-24/optimizer.pt +1 -1
checkpoint-24/scheduler.pt +1 -1
checkpoint-24/trainer_state.json +11 -11
checkpoint-24/training_args.bin +1 -1
checkpoint-242/model.safetensors +1 -1
checkpoint-242/optimizer.pt +1 -1
checkpoint-242/scheduler.pt +1 -1
checkpoint-242/trainer_state.json +81 -81
checkpoint-242/training_args.bin +1 -1
checkpoint-266/model.safetensors +1 -1
checkpoint-266/optimizer.pt +1 -1
checkpoint-266/scheduler.pt +1 -1
checkpoint-266/trainer_state.json +90 -90
checkpoint-266/training_args.bin +1 -1
checkpoint-291/model.safetensors +1 -1
checkpoint-291/optimizer.pt +1 -1
checkpoint-291/scheduler.pt +1 -1
checkpoint-291/trainer_state.json +96 -96
checkpoint-291/training_args.bin +1 -1
checkpoint-315/model.safetensors +1 -1
checkpoint-315/optimizer.pt +1 -1
checkpoint-315/scheduler.pt +1 -1
checkpoint-315/trainer_state.json +105 -105

README.md CHANGED Viewed

@@ -21,11 +21,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4341
-- Accuracy: 0.8656
-- Precision: 0.8628
-- Recall: 0.8656
-- F1: 0.8629
 ## Model description
@@ -44,7 +44,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0003
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 123
@@ -53,22 +53,26 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.4
-- num_epochs: 10
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
-|:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| No log        | 0.9897 | 24   | 1.1718          | 0.4832   | 0.2335    | 0.4832 | 0.3148 |
-| No log        | 1.9794 | 48   | 0.7551          | 0.7235   | 0.7164    | 0.7235 | 0.7026 |
-| No log        | 2.9691 | 72   | 0.6834          | 0.7313   | 0.7621    | 0.7313 | 0.7074 |
-| No log        | 4.0    | 97   | 0.9938          | 0.6202   | 0.6844    | 0.6202 | 0.6161 |
-| No log        | 4.9897 | 121  | 0.4973          | 0.7881   | 0.7961    | 0.7881 | 0.7854 |
-| No log        | 5.9794 | 145  | 0.5254          | 0.7804   | 0.7843    | 0.7804 | 0.7817 |
-| No log        | 6.9691 | 169  | 0.4264          | 0.8475   | 0.8558    | 0.8475 | 0.8504 |
-| No log        | 8.0    | 194  | 0.4415          | 0.8656   | 0.8670    | 0.8656 | 0.8628 |
-| No log        | 8.9897 | 218  | 0.4115          | 0.8656   | 0.8651    | 0.8656 | 0.8649 |
-| No log        | 9.8969 | 240  | 0.4341          | 0.8656   | 0.8628    | 0.8656 | 0.8629 |
 ### Framework versions

 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4448
+- Accuracy: 0.8553
+- Precision: 0.8527
+- Recall: 0.8553
+- F1: 0.8522
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0001
 - train_batch_size: 8
 - eval_batch_size: 8
 - seed: 123
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.4
+- num_epochs: 15
 ### Training results
+| Training Loss | Epoch   | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
+|:-------------:|:-------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| No log        | 0.9897  | 24   | 1.3056          | 0.4341   | 0.1885    | 0.4341 | 0.2628 |
+| No log        | 1.9794  | 48   | 1.1732          | 0.4341   | 0.1885    | 0.4341 | 0.2628 |
+| No log        | 2.9691  | 72   | 0.9256          | 0.6357   | 0.6651    | 0.6357 | 0.5935 |
+| No log        | 4.0     | 97   | 0.7872          | 0.6563   | 0.6724    | 0.6563 | 0.6387 |
+| No log        | 4.9897  | 121  | 0.6242          | 0.7597   | 0.7615    | 0.7597 | 0.7448 |
+| No log        | 5.9794  | 145  | 0.5990          | 0.7726   | 0.8035    | 0.7726 | 0.7744 |
+| No log        | 6.9691  | 169  | 0.5286          | 0.7907   | 0.8075    | 0.7907 | 0.7889 |
+| No log        | 8.0     | 194  | 0.4616          | 0.8140   | 0.8345    | 0.8140 | 0.8191 |
+| No log        | 8.9897  | 218  | 0.5001          | 0.8114   | 0.8142    | 0.8114 | 0.8021 |
+| No log        | 9.9794  | 242  | 0.4530          | 0.8165   | 0.8131    | 0.8165 | 0.8126 |
+| No log        | 10.9691 | 266  | 0.4203          | 0.8553   | 0.8586    | 0.8553 | 0.8544 |
+| No log        | 12.0    | 291  | 0.4621          | 0.8450   | 0.8423    | 0.8450 | 0.8402 |
+| No log        | 12.9897 | 315  | 0.4583          | 0.8501   | 0.8493    | 0.8501 | 0.8471 |
+| No log        | 13.9794 | 339  | 0.4448          | 0.8553   | 0.8527    | 0.8553 | 0.8522 |
 ### Framework versions

checkpoint-121/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70018b912cc31f04407d1e82b6579b497cb0a4c9d1fe58cce991fc2459540c94
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:1939f9981d9c8176b8e2ef6ece92977f9623abe931e4298abd38d6642f59f5e0
 size 94765560

checkpoint-121/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:997c0052dc18c15b0c00ff6b7f5f979b1f10ee85d5dd478ac31aec3c59104615
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:97f71385a72419ee05ba30d63e105082967d8ab9f6d1911eb2e7835404967095
 size 189556666

checkpoint-121/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f9c5f2a04362b085af0242d72c5af05a769e7bae4cee46ee7d346c9df7f1eba
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:05c1e98f43f6f001d63e1530acd921a7d70d5042210d56e33079392df6fbf6ed
 size 1064

checkpoint-121/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.7881136950904393,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 4.989690721649485,
   "eval_steps": 500,
@@ -10,69 +10,69 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7235142118863049,
-      "eval_f1": 0.7025965349533153,
-      "eval_loss": 0.7550917863845825,
-      "eval_precision": 0.7163905403042491,
-      "eval_recall": 0.7235142118863049,
-      "eval_runtime": 1.6003,
-      "eval_samples_per_second": 241.836,
-      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7312661498708011,
-      "eval_f1": 0.7074435618655927,
-      "eval_loss": 0.6834394335746765,
-      "eval_precision": 0.7620582207432803,
-      "eval_recall": 0.7312661498708011,
-      "eval_runtime": 1.604,
-      "eval_samples_per_second": 241.278,
-      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.6201550387596899,
-      "eval_f1": 0.616059564047211,
-      "eval_loss": 0.9937827587127686,
-      "eval_precision": 0.6843785822798868,
-      "eval_recall": 0.6201550387596899,
-      "eval_runtime": 1.5998,
-      "eval_samples_per_second": 241.901,
-      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.7881136950904393,
-      "eval_f1": 0.7854190251131377,
-      "eval_loss": 0.4972754120826721,
-      "eval_precision": 0.7961139879912458,
-      "eval_recall": 0.7881136950904393,
-      "eval_runtime": 1.5913,
-      "eval_samples_per_second": 243.196,
-      "eval_steps_per_second": 30.792,
       "step": 121
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7596899224806202,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 4.989690721649485,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-121/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-145/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a9b4c786da0e0851be69580368fd5d534a86467be3071d9ea96324ca5e0176a7
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:33d599a25f75eb114df73c919291fb52b68c98855b78355db615bcc43f381711
 size 94765560

checkpoint-145/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a673f8f7ab1809cc9b549b3982b0a64589cbdccccf65a873c995d3b5ba6af28d
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:55eb26e80237b5f7b441b15ae3ac2ba04a224510202eedb6b4f807fcc5598dbc
 size 189556666

checkpoint-145/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ce77a15ff28da0b94b70192478b0d3dfb304ac1b9a3e90e47f0a9e682aca696
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:31ef73ef30733d66c33837a6a1caa2497a300ae95d575b39cf2cd805a422d9ad
 size 1064

checkpoint-145/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.7881136950904393,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 5.979381443298969,
   "eval_steps": 500,
   "global_step": 145,
@@ -10,81 +10,81 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7235142118863049,
-      "eval_f1": 0.7025965349533153,
-      "eval_loss": 0.7550917863845825,
-      "eval_precision": 0.7163905403042491,
-      "eval_recall": 0.7235142118863049,
-      "eval_runtime": 1.6003,
-      "eval_samples_per_second": 241.836,
-      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7312661498708011,
-      "eval_f1": 0.7074435618655927,
-      "eval_loss": 0.6834394335746765,
-      "eval_precision": 0.7620582207432803,
-      "eval_recall": 0.7312661498708011,
-      "eval_runtime": 1.604,
-      "eval_samples_per_second": 241.278,
-      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.6201550387596899,
-      "eval_f1": 0.616059564047211,
-      "eval_loss": 0.9937827587127686,
-      "eval_precision": 0.6843785822798868,
-      "eval_recall": 0.6201550387596899,
-      "eval_runtime": 1.5998,
-      "eval_samples_per_second": 241.901,
-      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.7881136950904393,
-      "eval_f1": 0.7854190251131377,
-      "eval_loss": 0.4972754120826721,
-      "eval_precision": 0.7961139879912458,
-      "eval_recall": 0.7881136950904393,
-      "eval_runtime": 1.5913,
-      "eval_samples_per_second": 243.196,
-      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7803617571059431,
-      "eval_f1": 0.781727235222138,
-      "eval_loss": 0.5254013538360596,
-      "eval_precision": 0.7843017570642586,
-      "eval_recall": 0.7803617571059431,
-      "eval_runtime": 1.6096,
-      "eval_samples_per_second": 240.428,
-      "eval_steps_per_second": 30.442,
       "step": 145
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.772609819121447,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-145",
   "epoch": 5.979381443298969,
   "eval_steps": 500,
   "global_step": 145,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-145/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-169/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0ddbb394005b9ac70d5bc17bcb01362284d0d2278a1e44b6ce7c3513e050d418
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7fe0ba576e277ef89da2b3ca1c5aa2e93a8917ae528f01a03f6dfdf1268ac6a
 size 94765560

checkpoint-169/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e66e987ee75130be9aa72386f5d1880fcb1b2c247117c7798a2a85074ab7eba
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:0311ff790bd7ab214d52d34a06580321ac9204750d3399ca3313dd76c3892bfc
 size 189556666

checkpoint-169/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:df821f017f2db25687bec6d111c0161751da33a1a44b650c4ff88a56a7c16d8f
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:31f4cbb3520d6827f9ee7c7377912e6794964491937f949c08d7bee3e3b6378b
 size 1064

checkpoint-169/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8475452196382429,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-169",
   "epoch": 6.969072164948454,
   "eval_steps": 500,
@@ -10,93 +10,93 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7235142118863049,
-      "eval_f1": 0.7025965349533153,
-      "eval_loss": 0.7550917863845825,
-      "eval_precision": 0.7163905403042491,
-      "eval_recall": 0.7235142118863049,
-      "eval_runtime": 1.6003,
-      "eval_samples_per_second": 241.836,
-      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7312661498708011,
-      "eval_f1": 0.7074435618655927,
-      "eval_loss": 0.6834394335746765,
-      "eval_precision": 0.7620582207432803,
-      "eval_recall": 0.7312661498708011,
-      "eval_runtime": 1.604,
-      "eval_samples_per_second": 241.278,
-      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.6201550387596899,
-      "eval_f1": 0.616059564047211,
-      "eval_loss": 0.9937827587127686,
-      "eval_precision": 0.6843785822798868,
-      "eval_recall": 0.6201550387596899,
-      "eval_runtime": 1.5998,
-      "eval_samples_per_second": 241.901,
-      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.7881136950904393,
-      "eval_f1": 0.7854190251131377,
-      "eval_loss": 0.4972754120826721,
-      "eval_precision": 0.7961139879912458,
-      "eval_recall": 0.7881136950904393,
-      "eval_runtime": 1.5913,
-      "eval_samples_per_second": 243.196,
-      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7803617571059431,
-      "eval_f1": 0.781727235222138,
-      "eval_loss": 0.5254013538360596,
-      "eval_precision": 0.7843017570642586,
-      "eval_recall": 0.7803617571059431,
-      "eval_runtime": 1.6096,
-      "eval_samples_per_second": 240.428,
-      "eval_steps_per_second": 30.442,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8504309219603966,
-      "eval_loss": 0.42636802792549133,
-      "eval_precision": 0.8557626671638175,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6741,
-      "eval_samples_per_second": 231.171,
-      "eval_steps_per_second": 29.27,
       "step": 169
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7906976744186046,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-169",
   "epoch": 6.969072164948454,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-169/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-194/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a3a627702cd14b16dbfa2578e7673bd3814fac0eb9375d373c2f06a0a1d5a738
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:baae35578ce27c737b5559c2b66510e84a496d80b00550c0dd5d72fcbb7ced0d
 size 94765560

checkpoint-194/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96506f68c35bc380113ed68f683cfdb89562b8e18cd99f04207e7f2cf6c07543
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:6bde7ea27c2658d4486314948eea84d2e6cb3342425e8a03c5e81c442be2dce5
 size 189556666

checkpoint-194/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9baadb1a4e65e06e7e3878b0e06173eb575209134ab9848c9fd367b8c2a762e0
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca2515f26554ebceb934b5250a537f0e70da384f3e37f2374ff2d98c54b8331c
 size 1064

checkpoint-194/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8656330749354005,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.0,
   "eval_steps": 500,
@@ -10,105 +10,105 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7235142118863049,
-      "eval_f1": 0.7025965349533153,
-      "eval_loss": 0.7550917863845825,
-      "eval_precision": 0.7163905403042491,
-      "eval_recall": 0.7235142118863049,
-      "eval_runtime": 1.6003,
-      "eval_samples_per_second": 241.836,
-      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7312661498708011,
-      "eval_f1": 0.7074435618655927,
-      "eval_loss": 0.6834394335746765,
-      "eval_precision": 0.7620582207432803,
-      "eval_recall": 0.7312661498708011,
-      "eval_runtime": 1.604,
-      "eval_samples_per_second": 241.278,
-      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.6201550387596899,
-      "eval_f1": 0.616059564047211,
-      "eval_loss": 0.9937827587127686,
-      "eval_precision": 0.6843785822798868,
-      "eval_recall": 0.6201550387596899,
-      "eval_runtime": 1.5998,
-      "eval_samples_per_second": 241.901,
-      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.7881136950904393,
-      "eval_f1": 0.7854190251131377,
-      "eval_loss": 0.4972754120826721,
-      "eval_precision": 0.7961139879912458,
-      "eval_recall": 0.7881136950904393,
-      "eval_runtime": 1.5913,
-      "eval_samples_per_second": 243.196,
-      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7803617571059431,
-      "eval_f1": 0.781727235222138,
-      "eval_loss": 0.5254013538360596,
-      "eval_precision": 0.7843017570642586,
-      "eval_recall": 0.7803617571059431,
-      "eval_runtime": 1.6096,
-      "eval_samples_per_second": 240.428,
-      "eval_steps_per_second": 30.442,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8504309219603966,
-      "eval_loss": 0.42636802792549133,
-      "eval_precision": 0.8557626671638175,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6741,
-      "eval_samples_per_second": 231.171,
-      "eval_steps_per_second": 29.27,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8656330749354005,
-      "eval_f1": 0.8627731371728347,
-      "eval_loss": 0.4414582848548889,
-      "eval_precision": 0.8670254176803228,
-      "eval_recall": 0.8656330749354005,
-      "eval_runtime": 1.6573,
-      "eval_samples_per_second": 233.512,
-      "eval_steps_per_second": 29.566,
       "step": 194
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.813953488372093,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-194/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-218/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28660ecbedd8800f912a5673efca37a66998ebce7acd99c4bc922036560b2975
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:5129276136473933fb458063a0adbebe29c1ebcb44e427a4cfd6df34f7fe79db
 size 94765560

checkpoint-218/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22cdbaee61cabc6fda6bb731be8bc654cb40396c4c4e2be92d86d4a184ef0728
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:653e15316ce9cbc92d4497de1066858cce0103cd3586d854ad0633718f85320c
 size 189556666

checkpoint-218/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05468f3e42af9ca556e835b8f8bb03232840d74963a2a7b94013d776ea21eb80
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:ed9b775c41ccbd0ddb1034a30399d9f5182b6429a8e768d1d1ee3277da7ac95d
 size 1064

checkpoint-218/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8656330749354005,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.989690721649485,
   "eval_steps": 500,
@@ -10,117 +10,117 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7235142118863049,
-      "eval_f1": 0.7025965349533153,
-      "eval_loss": 0.7550917863845825,
-      "eval_precision": 0.7163905403042491,
-      "eval_recall": 0.7235142118863049,
-      "eval_runtime": 1.6003,
-      "eval_samples_per_second": 241.836,
-      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7312661498708011,
-      "eval_f1": 0.7074435618655927,
-      "eval_loss": 0.6834394335746765,
-      "eval_precision": 0.7620582207432803,
-      "eval_recall": 0.7312661498708011,
-      "eval_runtime": 1.604,
-      "eval_samples_per_second": 241.278,
-      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.6201550387596899,
-      "eval_f1": 0.616059564047211,
-      "eval_loss": 0.9937827587127686,
-      "eval_precision": 0.6843785822798868,
-      "eval_recall": 0.6201550387596899,
-      "eval_runtime": 1.5998,
-      "eval_samples_per_second": 241.901,
-      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.7881136950904393,
-      "eval_f1": 0.7854190251131377,
-      "eval_loss": 0.4972754120826721,
-      "eval_precision": 0.7961139879912458,
-      "eval_recall": 0.7881136950904393,
-      "eval_runtime": 1.5913,
-      "eval_samples_per_second": 243.196,
-      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7803617571059431,
-      "eval_f1": 0.781727235222138,
-      "eval_loss": 0.5254013538360596,
-      "eval_precision": 0.7843017570642586,
-      "eval_recall": 0.7803617571059431,
-      "eval_runtime": 1.6096,
-      "eval_samples_per_second": 240.428,
-      "eval_steps_per_second": 30.442,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8504309219603966,
-      "eval_loss": 0.42636802792549133,
-      "eval_precision": 0.8557626671638175,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6741,
-      "eval_samples_per_second": 231.171,
-      "eval_steps_per_second": 29.27,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8656330749354005,
-      "eval_f1": 0.8627731371728347,
-      "eval_loss": 0.4414582848548889,
-      "eval_precision": 0.8670254176803228,
-      "eval_recall": 0.8656330749354005,
-      "eval_runtime": 1.6573,
-      "eval_samples_per_second": 233.512,
-      "eval_steps_per_second": 29.566,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8656330749354005,
-      "eval_f1": 0.8648808138390941,
-      "eval_loss": 0.4115408658981323,
-      "eval_precision": 0.8650901526054525,
-      "eval_recall": 0.8656330749354005,
-      "eval_runtime": 1.6461,
-      "eval_samples_per_second": 235.106,
-      "eval_steps_per_second": 29.768,
       "step": 218
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.813953488372093,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.989690721649485,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8113695090439277,
+      "eval_f1": 0.8021117074140329,
+      "eval_loss": 0.5000612735748291,
+      "eval_precision": 0.8141611295681063,
+      "eval_recall": 0.8113695090439277,
+      "eval_runtime": 1.6675,
+      "eval_samples_per_second": 232.083,
+      "eval_steps_per_second": 29.385,
       "step": 218
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-218/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-24/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95db9670c0e00359e684b13ba791d256154dc75e057deabe4d20fd9d0554235
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4ae367d698cb4b2e6ff776f679b85a1196e77d049b832152d6bd4ad705a5419
 size 94765560

checkpoint-24/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a82ca177e922f7eb2017da7cfd0f85cb2f6f94396cd239a01bca3e3798f310b8
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:b92d718808a7945f2b041265bbb510cac2fcd60f2bd0f446c630ca9abb3c6ecd
 size 189556666

checkpoint-24/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:199b7ea3cf1a15c2128c334c968f9f4a32fee4fdb9c39d77658a7126eada7cf8
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d5d0d6ddafc4ad00c987b5d1beff7b3561a3dc543c6b67f789c33e6fa494a9d
 size 1064

checkpoint-24/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.48320413436692505,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-24",
   "epoch": 0.9896907216494846,
   "eval_steps": 500,
@@ -10,21 +10,21 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.48320413436692505,
-      "eval_f1": 0.31484032448297905,
-      "eval_loss": 1.1717983484268188,
-      "eval_precision": 0.23348623546928937,
-      "eval_recall": 0.48320413436692505,
-      "eval_runtime": 1.6682,
-      "eval_samples_per_second": 231.984,
-      "eval_steps_per_second": 29.373,
       "step": 24
     }
   ],
   "logging_steps": 500,
-  "max_steps": 240,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.43410852713178294,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-24",
   "epoch": 0.9896907216494846,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     }
   ],
   "logging_steps": 500,
+  "max_steps": 360,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-24/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-242/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2c3c3acfb39a1584bdad8c4452c6a99cc55d03b67d4754ef55bdc31be94eb5b7
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:c039c1b758751ec121fc469bc7547e1982caf925c239f0210a25629f20fcc808
 size 94765560

checkpoint-242/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:529f05dfd1fdfa07d440221559587dda8eded6dd4e7f89fd777f0ac7f24f5fee
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:9b3d6cee0f14c6a503cbdbf9fd578d74b21bb5ca1a160a77577df181e0a24ca4
 size 189556666

checkpoint-242/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:781bb61f6baa40042311c990cc82713d83cdc179ccb43dbb9cdd148961a2e8ad
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a84ec1b939f46a9a8aabb9a272f34dbebd1f7c4378749e925f2e59c5f4fa3e4
 size 1064

checkpoint-242/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8578811369509044,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-242",
   "epoch": 9.97938144329897,
   "eval_steps": 500,
@@ -10,122 +10,122 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8473710740005564,
-      "eval_loss": 0.4363822937011719,
-      "eval_precision": 0.8483238707679635,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6838,
-      "eval_samples_per_second": 229.835,
-      "eval_steps_per_second": 29.101,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
-      "eval_accuracy": 0.8578811369509044,
-      "eval_f1": 0.8567532661685897,
-      "eval_loss": 0.42906680703163147,
-      "eval_precision": 0.8560504853170988,
-      "eval_recall": 0.8578811369509044,
-      "eval_runtime": 1.6875,
-      "eval_samples_per_second": 229.333,
-      "eval_steps_per_second": 29.037,
       "step": 242
     }
   ],

 {
+  "best_metric": 0.8165374677002584,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-242",
   "epoch": 9.97938144329897,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8113695090439277,
+      "eval_f1": 0.8021117074140329,
+      "eval_loss": 0.5000612735748291,
+      "eval_precision": 0.8141611295681063,
+      "eval_recall": 0.8113695090439277,
+      "eval_runtime": 1.6675,
+      "eval_samples_per_second": 232.083,
+      "eval_steps_per_second": 29.385,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
+      "eval_accuracy": 0.8165374677002584,
+      "eval_f1": 0.8125708918966329,
+      "eval_loss": 0.4529660940170288,
+      "eval_precision": 0.8130985716009446,
+      "eval_recall": 0.8165374677002584,
+      "eval_runtime": 1.6635,
+      "eval_samples_per_second": 232.639,
+      "eval_steps_per_second": 29.456,
       "step": 242
     }
   ],

checkpoint-242/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-266/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b40af64761e85d5fea70c649217c8cc140a31cb9ca6b3839f952a2bb9f87e0b2
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:c27c7790fb0d0e3d63b0164e19322c55c710c87be9b9e7cfd68ac7458a7b8b64
 size 94765560

checkpoint-266/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2157435343c02544baabe61713043b7b3749a01b1cc4aeeb2340f89faf040460
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:d98d5ad73bbffe35a1d38bc982d963fd54e116f0e7fd327bae41f2db23ea9d88
 size 189556666

checkpoint-266/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:431e6d6d13cfa84e3db2d479446a897f9f93f4718bfe0ac4b68d73256eda8d91
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa01376065b837c8a8be09b795bba516d496776d4563c1bd964ea469929491d5
 size 1064

checkpoint-266/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8578811369509044,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-242",
   "epoch": 10.969072164948454,
   "eval_steps": 500,
   "global_step": 266,
@@ -10,134 +10,134 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8473710740005564,
-      "eval_loss": 0.4363822937011719,
-      "eval_precision": 0.8483238707679635,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6838,
-      "eval_samples_per_second": 229.835,
-      "eval_steps_per_second": 29.101,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
-      "eval_accuracy": 0.8578811369509044,
-      "eval_f1": 0.8567532661685897,
-      "eval_loss": 0.42906680703163147,
-      "eval_precision": 0.8560504853170988,
-      "eval_recall": 0.8578811369509044,
-      "eval_runtime": 1.6875,
-      "eval_samples_per_second": 229.333,
-      "eval_steps_per_second": 29.037,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
-      "eval_accuracy": 0.8501291989664083,
-      "eval_f1": 0.8527674409653727,
-      "eval_loss": 0.46987947821617126,
-      "eval_precision": 0.858217159873796,
-      "eval_recall": 0.8501291989664083,
-      "eval_runtime": 1.6795,
-      "eval_samples_per_second": 230.425,
-      "eval_steps_per_second": 29.175,
       "step": 266
     }
   ],

 {
+  "best_metric": 0.8552971576227391,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-266",
   "epoch": 10.969072164948454,
   "eval_steps": 500,
   "global_step": 266,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8113695090439277,
+      "eval_f1": 0.8021117074140329,
+      "eval_loss": 0.5000612735748291,
+      "eval_precision": 0.8141611295681063,
+      "eval_recall": 0.8113695090439277,
+      "eval_runtime": 1.6675,
+      "eval_samples_per_second": 232.083,
+      "eval_steps_per_second": 29.385,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
+      "eval_accuracy": 0.8165374677002584,
+      "eval_f1": 0.8125708918966329,
+      "eval_loss": 0.4529660940170288,
+      "eval_precision": 0.8130985716009446,
+      "eval_recall": 0.8165374677002584,
+      "eval_runtime": 1.6635,
+      "eval_samples_per_second": 232.639,
+      "eval_steps_per_second": 29.456,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
+      "eval_accuracy": 0.8552971576227391,
+      "eval_f1": 0.8544131646946824,
+      "eval_loss": 0.4202619791030884,
+      "eval_precision": 0.8585534724896462,
+      "eval_recall": 0.8552971576227391,
+      "eval_runtime": 1.6427,
+      "eval_samples_per_second": 235.585,
+      "eval_steps_per_second": 29.829,
       "step": 266
     }
   ],

checkpoint-266/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-291/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f47d00b50afe8f783e4bf6f910a770b985446e9c936205d750ce95a2c463cbf3
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0bb3d75286bab3d1cdcb26cb55ac58213a576ca559220ce7c256cd49a3933c5
 size 94765560

checkpoint-291/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:41c1f039c3b8800766242328eaa5d76f19b0a28b425876e5045d7114823501fe
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:1f9b7310c27516ef517a6c5e8f61fd09550e97bc3995b7435afd54a616db18dd
 size 189556666

checkpoint-291/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e4fa6a80ced34d80d85c2cda8f22c82979b4cdae444e81fcc24e1cd53d6a4cf2
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:f29254c7742362677883a21732c9472c2f09e4b6371a56cd238ad172f6f4bc9d
 size 1064

checkpoint-291/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8578811369509044,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-242",
   "epoch": 12.0,
   "eval_steps": 500,
   "global_step": 291,
@@ -10,146 +10,146 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8473710740005564,
-      "eval_loss": 0.4363822937011719,
-      "eval_precision": 0.8483238707679635,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6838,
-      "eval_samples_per_second": 229.835,
-      "eval_steps_per_second": 29.101,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
-      "eval_accuracy": 0.8578811369509044,
-      "eval_f1": 0.8567532661685897,
-      "eval_loss": 0.42906680703163147,
-      "eval_precision": 0.8560504853170988,
-      "eval_recall": 0.8578811369509044,
-      "eval_runtime": 1.6875,
-      "eval_samples_per_second": 229.333,
-      "eval_steps_per_second": 29.037,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
-      "eval_accuracy": 0.8501291989664083,
-      "eval_f1": 0.8527674409653727,
-      "eval_loss": 0.46987947821617126,
-      "eval_precision": 0.858217159873796,
-      "eval_recall": 0.8501291989664083,
-      "eval_runtime": 1.6795,
-      "eval_samples_per_second": 230.425,
-      "eval_steps_per_second": 29.175,
       "step": 266
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.8449612403100775,
-      "eval_f1": 0.8479775479649662,
-      "eval_loss": 0.48616188764572144,
-      "eval_precision": 0.8536273463382107,
       "eval_recall": 0.8449612403100775,
-      "eval_runtime": 1.6948,
-      "eval_samples_per_second": 228.339,
-      "eval_steps_per_second": 28.911,
       "step": 291
     }
   ],

 {
+  "best_metric": 0.8552971576227391,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-266",
   "epoch": 12.0,
   "eval_steps": 500,
   "global_step": 291,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8113695090439277,
+      "eval_f1": 0.8021117074140329,
+      "eval_loss": 0.5000612735748291,
+      "eval_precision": 0.8141611295681063,
+      "eval_recall": 0.8113695090439277,
+      "eval_runtime": 1.6675,
+      "eval_samples_per_second": 232.083,
+      "eval_steps_per_second": 29.385,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
+      "eval_accuracy": 0.8165374677002584,
+      "eval_f1": 0.8125708918966329,
+      "eval_loss": 0.4529660940170288,
+      "eval_precision": 0.8130985716009446,
+      "eval_recall": 0.8165374677002584,
+      "eval_runtime": 1.6635,
+      "eval_samples_per_second": 232.639,
+      "eval_steps_per_second": 29.456,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
+      "eval_accuracy": 0.8552971576227391,
+      "eval_f1": 0.8544131646946824,
+      "eval_loss": 0.4202619791030884,
+      "eval_precision": 0.8585534724896462,
+      "eval_recall": 0.8552971576227391,
+      "eval_runtime": 1.6427,
+      "eval_samples_per_second": 235.585,
+      "eval_steps_per_second": 29.829,
       "step": 266
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.8449612403100775,
+      "eval_f1": 0.8402394437564343,
+      "eval_loss": 0.46208810806274414,
+      "eval_precision": 0.8423482544611124,
       "eval_recall": 0.8449612403100775,
+      "eval_runtime": 1.6537,
+      "eval_samples_per_second": 234.014,
+      "eval_steps_per_second": 29.63,
       "step": 291
     }
   ],

checkpoint-291/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c6f714e9e8c7d28837d7af7be0484ab61be5f65a97f38bd6a3066e5b48907ab
 size 5240

checkpoint-315/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1700c80d575b455dce88b4e3c764090727ae02d64f4125396c1001f9bd02bd57
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:5bb78ec1a1f8bf4d1275bf57ac0b3ee703492f522708754f9c23186aadb8ddc6
 size 94765560

checkpoint-315/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fca7dfcd62a0d46fcb8d64a5382493902a875243c0bf05e743cbde3de662707e
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:960f106a9ac787d0f0ca7217efd249996acde184597425b6324d4dbd2488881b
 size 189556666

checkpoint-315/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:956285c3102bd85589a4c94d7acca82629b8e4407131906dba6bfe9c2568df92
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9f1664f3c8866077a188c06b3bbbe492614b02e317a58b2358028d07588fd98b
 size 1064

checkpoint-315/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8578811369509044,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-242",
   "epoch": 12.989690721649485,
   "eval_steps": 500,
   "global_step": 315,
@@ -10,158 +10,158 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8473710740005564,
-      "eval_loss": 0.4363822937011719,
-      "eval_precision": 0.8483238707679635,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6838,
-      "eval_samples_per_second": 229.835,
-      "eval_steps_per_second": 29.101,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
-      "eval_accuracy": 0.8578811369509044,
-      "eval_f1": 0.8567532661685897,
-      "eval_loss": 0.42906680703163147,
-      "eval_precision": 0.8560504853170988,
-      "eval_recall": 0.8578811369509044,
-      "eval_runtime": 1.6875,
-      "eval_samples_per_second": 229.333,
-      "eval_steps_per_second": 29.037,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
-      "eval_accuracy": 0.8501291989664083,
-      "eval_f1": 0.8527674409653727,
-      "eval_loss": 0.46987947821617126,
-      "eval_precision": 0.858217159873796,
-      "eval_recall": 0.8501291989664083,
-      "eval_runtime": 1.6795,
-      "eval_samples_per_second": 230.425,
-      "eval_steps_per_second": 29.175,
       "step": 266
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.8449612403100775,
-      "eval_f1": 0.8479775479649662,
-      "eval_loss": 0.48616188764572144,
-      "eval_precision": 0.8536273463382107,
       "eval_recall": 0.8449612403100775,
-      "eval_runtime": 1.6948,
-      "eval_samples_per_second": 228.339,
-      "eval_steps_per_second": 28.911,
       "step": 291
     },
     {
       "epoch": 12.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8483528512434715,
-      "eval_loss": 0.4765341877937317,
-      "eval_precision": 0.8497431189750078,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.688,
-      "eval_samples_per_second": 229.264,
-      "eval_steps_per_second": 29.028,
       "step": 315
     }
   ],
@@ -186,7 +186,7 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": true
       },
       "attributes": {}
     }

 {
+  "best_metric": 0.8552971576227391,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-266",
   "epoch": 12.989690721649485,
   "eval_steps": 500,
   "global_step": 315,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.305585265159607,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6799,
+      "eval_samples_per_second": 230.371,
+      "eval_steps_per_second": 29.168,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.43410852713178294,
+      "eval_f1": 0.2628116488581605,
+      "eval_loss": 1.1732141971588135,
+      "eval_precision": 0.18845021332852593,
+      "eval_recall": 0.43410852713178294,
+      "eval_runtime": 1.6247,
+      "eval_samples_per_second": 238.193,
+      "eval_steps_per_second": 30.159,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.6356589147286822,
+      "eval_f1": 0.5935030180725367,
+      "eval_loss": 0.9256265163421631,
+      "eval_precision": 0.6651105917100348,
+      "eval_recall": 0.6356589147286822,
+      "eval_runtime": 1.639,
+      "eval_samples_per_second": 236.125,
+      "eval_steps_per_second": 29.897,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6563307493540051,
+      "eval_f1": 0.6387188198872827,
+      "eval_loss": 0.787194550037384,
+      "eval_precision": 0.6724057806653244,
+      "eval_recall": 0.6563307493540051,
+      "eval_runtime": 1.6513,
+      "eval_samples_per_second": 234.36,
+      "eval_steps_per_second": 29.673,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7596899224806202,
+      "eval_f1": 0.7447530111625,
+      "eval_loss": 0.6241620182991028,
+      "eval_precision": 0.7615023606202671,
+      "eval_recall": 0.7596899224806202,
+      "eval_runtime": 1.6695,
+      "eval_samples_per_second": 231.805,
+      "eval_steps_per_second": 29.35,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.772609819121447,
+      "eval_f1": 0.7744367108711326,
+      "eval_loss": 0.5990303158760071,
+      "eval_precision": 0.8035211915446686,
+      "eval_recall": 0.772609819121447,
+      "eval_runtime": 1.7017,
+      "eval_samples_per_second": 227.425,
+      "eval_steps_per_second": 28.795,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.7906976744186046,
+      "eval_f1": 0.7889441910896717,
+      "eval_loss": 0.5285641551017761,
+      "eval_precision": 0.8075499035137905,
+      "eval_recall": 0.7906976744186046,
+      "eval_runtime": 1.6621,
+      "eval_samples_per_second": 232.838,
+      "eval_steps_per_second": 29.481,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.813953488372093,
+      "eval_f1": 0.8191057475344072,
+      "eval_loss": 0.461563378572464,
+      "eval_precision": 0.8344562802960127,
+      "eval_recall": 0.813953488372093,
+      "eval_runtime": 1.6538,
+      "eval_samples_per_second": 234.004,
+      "eval_steps_per_second": 29.628,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8113695090439277,
+      "eval_f1": 0.8021117074140329,
+      "eval_loss": 0.5000612735748291,
+      "eval_precision": 0.8141611295681063,
+      "eval_recall": 0.8113695090439277,
+      "eval_runtime": 1.6675,
+      "eval_samples_per_second": 232.083,
+      "eval_steps_per_second": 29.385,
       "step": 218
     },
     {
       "epoch": 9.97938144329897,
+      "eval_accuracy": 0.8165374677002584,
+      "eval_f1": 0.8125708918966329,
+      "eval_loss": 0.4529660940170288,
+      "eval_precision": 0.8130985716009446,
+      "eval_recall": 0.8165374677002584,
+      "eval_runtime": 1.6635,
+      "eval_samples_per_second": 232.639,
+      "eval_steps_per_second": 29.456,
       "step": 242
     },
     {
       "epoch": 10.969072164948454,
+      "eval_accuracy": 0.8552971576227391,
+      "eval_f1": 0.8544131646946824,
+      "eval_loss": 0.4202619791030884,
+      "eval_precision": 0.8585534724896462,
+      "eval_recall": 0.8552971576227391,
+      "eval_runtime": 1.6427,
+      "eval_samples_per_second": 235.585,
+      "eval_steps_per_second": 29.829,
       "step": 266
     },
     {
       "epoch": 12.0,
       "eval_accuracy": 0.8449612403100775,
+      "eval_f1": 0.8402394437564343,
+      "eval_loss": 0.46208810806274414,
+      "eval_precision": 0.8423482544611124,
       "eval_recall": 0.8449612403100775,
+      "eval_runtime": 1.6537,
+      "eval_samples_per_second": 234.014,
+      "eval_steps_per_second": 29.63,
       "step": 291
     },
     {
       "epoch": 12.989690721649485,
+      "eval_accuracy": 0.8501291989664083,
+      "eval_f1": 0.8470800661185643,
+      "eval_loss": 0.4583089351654053,
+      "eval_precision": 0.8492839490324154,
+      "eval_recall": 0.8501291989664083,
+      "eval_runtime": 1.6679,
+      "eval_samples_per_second": 232.035,
+      "eval_steps_per_second": 29.379,
       "step": 315
     }
   ],
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": false
       },
       "attributes": {}
     }