Training in progress, epoch 0

Browse files

Files changed (16) hide show

.ipynb_checkpoints/train_results-checkpoint.json +8 -0
.ipynb_checkpoints/trainer_state-checkpoint.json +358 -0
all_results.json +8 -0
config.json +22 -22
pytorch_model.bin +1 -1
runs/Mar06_20-27-29_pop-os/events.out.tfevents.1678138748.pop-os.6196.4 +3 -0
runs/Mar07_13-53-02_pop-os/events.out.tfevents.1678197251.pop-os.7668.0 +3 -0
runs/Mar07_13-53-02_pop-os/events.out.tfevents.1678197956.pop-os.7668.1 +3 -0
runs/Mar07_14-05-09_pop-os/1678198251.5063524/events.out.tfevents.1678198251.pop-os.7668.4 +3 -0
runs/Mar07_14-05-09_pop-os/events.out.tfevents.1678198063.pop-os.7668.2 +3 -0
runs/Mar07_14-05-09_pop-os/events.out.tfevents.1678198251.pop-os.7668.3 +3 -0
runs/Mar07_14-11-04_pop-os/1678198277.4953692/events.out.tfevents.1678198277.pop-os.7668.6 +3 -0
runs/Mar07_14-11-04_pop-os/events.out.tfevents.1678198277.pop-os.7668.5 +3 -0
train_results.json +8 -0
trainer_state.json +358 -0
training_args.bin +1 -1

.ipynb_checkpoints/train_results-checkpoint.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.2743012151733248e+18,
+    "train_loss": 0.393069394557332,
+    "train_runtime": 1296.2409,
+    "train_samples_per_second": 12.704,
+    "train_steps_per_second": 0.396
+}

.ipynb_checkpoints/trainer_state-checkpoint.json ADDED Viewed

	@@ -0,0 +1,358 @@

+{
+  "best_metric": 0.9373634377276038,
+  "best_model_checkpoint": "./weather-base/checkpoint-342",
+  "epoch": 2.995633187772926,
+  "global_step": 513,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.615384615384616e-06,
+      "loss": 2.5162,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.923076923076923e-05,
+      "loss": 2.2089,
+      "step": 20
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 2.8846153846153845e-05,
+      "loss": 1.744,
+      "step": 30
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 3.846153846153846e-05,
+      "loss": 1.1145,
+      "step": 40
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.8076923076923084e-05,
+      "loss": 0.7667,
+      "step": 50
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.9132321041214754e-05,
+      "loss": 0.6373,
+      "step": 60
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.804772234273319e-05,
+      "loss": 0.4996,
+      "step": 70
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.696312364425163e-05,
+      "loss": 0.429,
+      "step": 80
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.587852494577007e-05,
+      "loss": 0.4243,
+      "step": 90
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.47939262472885e-05,
+      "loss": 0.3769,
+      "step": 100
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 4.370932754880694e-05,
+      "loss": 0.4072,
+      "step": 110
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.262472885032538e-05,
+      "loss": 0.3406,
+      "step": 120
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.154013015184382e-05,
+      "loss": 0.3224,
+      "step": 130
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.045553145336225e-05,
+      "loss": 0.4434,
+      "step": 140
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.9370932754880696e-05,
+      "loss": 0.3797,
+      "step": 150
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.828633405639914e-05,
+      "loss": 0.316,
+      "step": 160
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.720173535791757e-05,
+      "loss": 0.3277,
+      "step": 170
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9002184996358339,
+      "eval_loss": 0.29298296570777893,
+      "eval_runtime": 34.0636,
+      "eval_samples_per_second": 40.307,
+      "eval_steps_per_second": 5.049,
+      "step": 171
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.611713665943601e-05,
+      "loss": 0.3201,
+      "step": 180
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.503253796095445e-05,
+      "loss": 0.3002,
+      "step": 190
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.394793926247289e-05,
+      "loss": 0.2141,
+      "step": 200
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.286334056399132e-05,
+      "loss": 0.2718,
+      "step": 210
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 3.1778741865509765e-05,
+      "loss": 0.2551,
+      "step": 220
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 3.06941431670282e-05,
+      "loss": 0.2694,
+      "step": 230
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.960954446854664e-05,
+      "loss": 0.3507,
+      "step": 240
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.8524945770065074e-05,
+      "loss": 0.2558,
+      "step": 250
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.7440347071583517e-05,
+      "loss": 0.185,
+      "step": 260
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.635574837310195e-05,
+      "loss": 0.2202,
+      "step": 270
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 2.5271149674620394e-05,
+      "loss": 0.2468,
+      "step": 280
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 2.418655097613883e-05,
+      "loss": 0.2374,
+      "step": 290
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 2.3101952277657267e-05,
+      "loss": 0.2063,
+      "step": 300
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 2.2017353579175707e-05,
+      "loss": 0.1711,
+      "step": 310
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 2.0932754880694143e-05,
+      "loss": 0.2644,
+      "step": 320
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 1.9848156182212583e-05,
+      "loss": 0.2194,
+      "step": 330
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.876355748373102e-05,
+      "loss": 0.2401,
+      "step": 340
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9373634377276038,
+      "eval_loss": 0.19143207371234894,
+      "eval_runtime": 72.116,
+      "eval_samples_per_second": 19.039,
+      "eval_steps_per_second": 2.385,
+      "step": 342
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.767895878524946e-05,
+      "loss": 0.1665,
+      "step": 350
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.6594360086767896e-05,
+      "loss": 0.1463,
+      "step": 360
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 1.5509761388286336e-05,
+      "loss": 0.1939,
+      "step": 370
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 1.4425162689804772e-05,
+      "loss": 0.2001,
+      "step": 380
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.334056399132321e-05,
+      "loss": 0.2046,
+      "step": 390
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 1.225596529284165e-05,
+      "loss": 0.172,
+      "step": 400
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 1.1171366594360088e-05,
+      "loss": 0.1597,
+      "step": 410
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 1.0086767895878525e-05,
+      "loss": 0.1624,
+      "step": 420
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 9.002169197396963e-06,
+      "loss": 0.1609,
+      "step": 430
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 7.917570498915401e-06,
+      "loss": 0.1972,
+      "step": 440
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.832971800433839e-06,
+      "loss": 0.1007,
+      "step": 450
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 5.748373101952278e-06,
+      "loss": 0.0885,
+      "step": 460
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 4.663774403470715e-06,
+      "loss": 0.1321,
+      "step": 470
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 3.5791757049891544e-06,
+      "loss": 0.1699,
+      "step": 480
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 2.4945770065075926e-06,
+      "loss": 0.1647,
+      "step": 490
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 1.4099783080260303e-06,
+      "loss": 0.1175,
+      "step": 500
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 3.2537960954446857e-07,
+      "loss": 0.1036,
+      "step": 510
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9359067734887109,
+      "eval_loss": 0.18145906925201416,
+      "eval_runtime": 29.9478,
+      "eval_samples_per_second": 45.846,
+      "eval_steps_per_second": 5.743,
+      "step": 513
+    },
+    {
+      "epoch": 3.0,
+      "step": 513,
+      "total_flos": 1.2743012151733248e+18,
+      "train_loss": 0.393069394557332,
+      "train_runtime": 1296.2409,
+      "train_samples_per_second": 12.704,
+      "train_steps_per_second": 0.396
+    }
+  ],
+  "max_steps": 513,
+  "num_train_epochs": 3,
+  "total_flos": 1.2743012151733248e+18,
+  "trial_name": null,
+  "trial_params": null
+}

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.2743012151733248e+18,
+    "train_loss": 0.393069394557332,
+    "train_runtime": 1296.2409,
+    "train_samples_per_second": 12.704,
+    "train_steps_per_second": 0.396
+}

config.json CHANGED Viewed

@@ -13,33 +13,33 @@
   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
-    "0": "LABEL_0",
-    "1": "LABEL_1",
-    "2": "LABEL_2",
-    "3": "LABEL_3",
-    "4": "LABEL_4",
-    "5": "LABEL_5",
-    "6": "LABEL_6",
-    "7": "LABEL_7",
-    "8": "LABEL_8",
-    "9": "LABEL_9",
-    "10": "LABEL_10"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "LABEL_0": 0,
-    "LABEL_1": 1,
-    "LABEL_10": 10,
-    "LABEL_2": 2,
-    "LABEL_3": 3,
-    "LABEL_4": 4,
-    "LABEL_5": 5,
-    "LABEL_6": 6,
-    "LABEL_7": 7,
-    "LABEL_8": 8,
-    "LABEL_9": 9
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

   "hidden_dropout_prob": 0.0,
   "hidden_size": 768,
   "id2label": {
+    "0": "dew",
+    "1": "fogsmog",
+    "2": "frost",
+    "3": "glaze",
+    "4": "hail",
+    "5": "lightning",
+    "6": "rain",
+    "7": "rainbow",
+    "8": "rime",
+    "9": "sandstorm",
+    "10": "snow"
   },
   "image_size": 224,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "dew": 0,
+    "fogsmog": 1,
+    "frost": 2,
+    "glaze": 3,
+    "hail": 4,
+    "lightning": 5,
+    "rain": 6,
+    "rainbow": 7,
+    "rime": 8,
+    "sandstorm": 9,
+    "snow": 10
   },
   "layer_norm_eps": 1e-12,
   "layer_scale_init_value": 0.1,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f8459e7cdc3e4c28647c1aa4660ea7389bd65e9ddbcc5a9e22a193a083e5a915
 size 346888057

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0c87f68a0a57af6f1603aa44f1c025ae2743dc2b81dca53289cc2d4e9f582d6
 size 346888057

runs/Mar06_20-27-29_pop-os/events.out.tfevents.1678138748.pop-os.6196.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:95987de583f564a55504a51983e490661424240ebbac4f1dd33a11d584cce2c7
+size 411

runs/Mar07_13-53-02_pop-os/events.out.tfevents.1678197251.pop-os.7668.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4e4e39f06e9231919cda4fa4724c225de457e3f1dc74a7e530cf21761e71cb3
+size 862

runs/Mar07_13-53-02_pop-os/events.out.tfevents.1678197956.pop-os.7668.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c58967cfc1336ed645b76f6801cfc052ca4b8b215d8fe43c0fd5eeee055a696
+size 346

runs/Mar07_14-05-09_pop-os/1678198251.5063524/events.out.tfevents.1678198251.pop-os.7668.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:785f575deeed53ced09d72b97a10530fcb7735e9437756fc52e33ffd23cf3b91
+size 5704

runs/Mar07_14-05-09_pop-os/events.out.tfevents.1678198063.pop-os.7668.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bbac53de7ffb298fadf73954d95dc61b2b4f2e007a2fcaf66c5ba2b352edf497
+size 346

runs/Mar07_14-05-09_pop-os/events.out.tfevents.1678198251.pop-os.7668.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eddaf63746f4c80aec4005afdd47b7dd29ad7b054210e7bf3373df8742e876bf
+size 4724

runs/Mar07_14-11-04_pop-os/1678198277.4953692/events.out.tfevents.1678198277.pop-os.7668.6 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:23b57a9936d5980141fc8043ee5a7dad8f3ee4678618be8670863eff7209be06
+size 5704

runs/Mar07_14-11-04_pop-os/events.out.tfevents.1678198277.pop-os.7668.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b4ea0beb513330b21d9181f2e29cc4fff6bfce3881f003ca18a318215f973e49
+size 7680

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.2743012151733248e+18,
+    "train_loss": 0.393069394557332,
+    "train_runtime": 1296.2409,
+    "train_samples_per_second": 12.704,
+    "train_steps_per_second": 0.396
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,358 @@

+{
+  "best_metric": 0.9373634377276038,
+  "best_model_checkpoint": "./weather-base/checkpoint-342",
+  "epoch": 2.995633187772926,
+  "global_step": 513,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.06,
+      "learning_rate": 9.615384615384616e-06,
+      "loss": 2.5162,
+      "step": 10
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.923076923076923e-05,
+      "loss": 2.2089,
+      "step": 20
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 2.8846153846153845e-05,
+      "loss": 1.744,
+      "step": 30
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 3.846153846153846e-05,
+      "loss": 1.1145,
+      "step": 40
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 4.8076923076923084e-05,
+      "loss": 0.7667,
+      "step": 50
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 4.9132321041214754e-05,
+      "loss": 0.6373,
+      "step": 60
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 4.804772234273319e-05,
+      "loss": 0.4996,
+      "step": 70
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 4.696312364425163e-05,
+      "loss": 0.429,
+      "step": 80
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.587852494577007e-05,
+      "loss": 0.4243,
+      "step": 90
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 4.47939262472885e-05,
+      "loss": 0.3769,
+      "step": 100
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 4.370932754880694e-05,
+      "loss": 0.4072,
+      "step": 110
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 4.262472885032538e-05,
+      "loss": 0.3406,
+      "step": 120
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.154013015184382e-05,
+      "loss": 0.3224,
+      "step": 130
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 4.045553145336225e-05,
+      "loss": 0.4434,
+      "step": 140
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.9370932754880696e-05,
+      "loss": 0.3797,
+      "step": 150
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 3.828633405639914e-05,
+      "loss": 0.316,
+      "step": 160
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 3.720173535791757e-05,
+      "loss": 0.3277,
+      "step": 170
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9002184996358339,
+      "eval_loss": 0.29298296570777893,
+      "eval_runtime": 34.0636,
+      "eval_samples_per_second": 40.307,
+      "eval_steps_per_second": 5.049,
+      "step": 171
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.611713665943601e-05,
+      "loss": 0.3201,
+      "step": 180
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.503253796095445e-05,
+      "loss": 0.3002,
+      "step": 190
+    },
+    {
+      "epoch": 1.17,
+      "learning_rate": 3.394793926247289e-05,
+      "loss": 0.2141,
+      "step": 200
+    },
+    {
+      "epoch": 1.23,
+      "learning_rate": 3.286334056399132e-05,
+      "loss": 0.2718,
+      "step": 210
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 3.1778741865509765e-05,
+      "loss": 0.2551,
+      "step": 220
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 3.06941431670282e-05,
+      "loss": 0.2694,
+      "step": 230
+    },
+    {
+      "epoch": 1.4,
+      "learning_rate": 2.960954446854664e-05,
+      "loss": 0.3507,
+      "step": 240
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 2.8524945770065074e-05,
+      "loss": 0.2558,
+      "step": 250
+    },
+    {
+      "epoch": 1.52,
+      "learning_rate": 2.7440347071583517e-05,
+      "loss": 0.185,
+      "step": 260
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 2.635574837310195e-05,
+      "loss": 0.2202,
+      "step": 270
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 2.5271149674620394e-05,
+      "loss": 0.2468,
+      "step": 280
+    },
+    {
+      "epoch": 1.69,
+      "learning_rate": 2.418655097613883e-05,
+      "loss": 0.2374,
+      "step": 290
+    },
+    {
+      "epoch": 1.75,
+      "learning_rate": 2.3101952277657267e-05,
+      "loss": 0.2063,
+      "step": 300
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 2.2017353579175707e-05,
+      "loss": 0.1711,
+      "step": 310
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 2.0932754880694143e-05,
+      "loss": 0.2644,
+      "step": 320
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 1.9848156182212583e-05,
+      "loss": 0.2194,
+      "step": 330
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 1.876355748373102e-05,
+      "loss": 0.2401,
+      "step": 340
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9373634377276038,
+      "eval_loss": 0.19143207371234894,
+      "eval_runtime": 72.116,
+      "eval_samples_per_second": 19.039,
+      "eval_steps_per_second": 2.385,
+      "step": 342
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 1.767895878524946e-05,
+      "loss": 0.1665,
+      "step": 350
+    },
+    {
+      "epoch": 2.1,
+      "learning_rate": 1.6594360086767896e-05,
+      "loss": 0.1463,
+      "step": 360
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 1.5509761388286336e-05,
+      "loss": 0.1939,
+      "step": 370
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 1.4425162689804772e-05,
+      "loss": 0.2001,
+      "step": 380
+    },
+    {
+      "epoch": 2.28,
+      "learning_rate": 1.334056399132321e-05,
+      "loss": 0.2046,
+      "step": 390
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 1.225596529284165e-05,
+      "loss": 0.172,
+      "step": 400
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 1.1171366594360088e-05,
+      "loss": 0.1597,
+      "step": 410
+    },
+    {
+      "epoch": 2.45,
+      "learning_rate": 1.0086767895878525e-05,
+      "loss": 0.1624,
+      "step": 420
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 9.002169197396963e-06,
+      "loss": 0.1609,
+      "step": 430
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 7.917570498915401e-06,
+      "loss": 0.1972,
+      "step": 440
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 6.832971800433839e-06,
+      "loss": 0.1007,
+      "step": 450
+    },
+    {
+      "epoch": 2.69,
+      "learning_rate": 5.748373101952278e-06,
+      "loss": 0.0885,
+      "step": 460
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 4.663774403470715e-06,
+      "loss": 0.1321,
+      "step": 470
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 3.5791757049891544e-06,
+      "loss": 0.1699,
+      "step": 480
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 2.4945770065075926e-06,
+      "loss": 0.1647,
+      "step": 490
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 1.4099783080260303e-06,
+      "loss": 0.1175,
+      "step": 500
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 3.2537960954446857e-07,
+      "loss": 0.1036,
+      "step": 510
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9359067734887109,
+      "eval_loss": 0.18145906925201416,
+      "eval_runtime": 29.9478,
+      "eval_samples_per_second": 45.846,
+      "eval_steps_per_second": 5.743,
+      "step": 513
+    },
+    {
+      "epoch": 3.0,
+      "step": 513,
+      "total_flos": 1.2743012151733248e+18,
+      "train_loss": 0.393069394557332,
+      "train_runtime": 1296.2409,
+      "train_samples_per_second": 12.704,
+      "train_steps_per_second": 0.396
+    }
+  ],
+  "max_steps": 513,
+  "num_train_epochs": 3,
+  "total_flos": 1.2743012151733248e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b055c8f159a84bc34a5370a55b3bca5340a1365dc9045c40b1593491008163f
 size 3515

 version https://git-lfs.github.com/spec/v1
+oid sha256:465c7388a74f286a54712bf921471f74f71cbc8f46aa3b7452041738835f202e
 size 3515