End of training

Browse files

Files changed (5) hide show

all_results.json +13 -0
eval_results.json +8 -0
runs/Dec25_18-39-21_LEGION/events.out.tfevents.1735120096.LEGION.19335.1 +3 -0
train_results.json +8 -0
trainer_state.json +384 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9773148148148149,
+    "eval_loss": 0.06807276606559753,
+    "eval_runtime": 7.6673,
+    "eval_samples_per_second": 281.717,
+    "eval_steps_per_second": 8.869,
+    "total_flos": 1.4499253204608614e+18,
+    "train_loss": 1.2673508875202715,
+    "train_runtime": 473.9541,
+    "train_samples_per_second": 123.05,
+    "train_steps_per_second": 0.962
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "eval_accuracy": 0.9773148148148149,
+    "eval_loss": 0.06807276606559753,
+    "eval_runtime": 7.6673,
+    "eval_samples_per_second": 281.717,
+    "eval_steps_per_second": 8.869
+}

runs/Dec25_18-39-21_LEGION/events.out.tfevents.1735120096.LEGION.19335.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:027392646f1d93afc8a36e7cc5ad667da8c8351a51e4b207469edda1440eae2f
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "total_flos": 1.4499253204608614e+18,
+    "train_loss": 1.2673508875202715,
+    "train_runtime": 473.9541,
+    "train_samples_per_second": 123.05,
+    "train_steps_per_second": 0.962
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,384 @@

+{
+  "best_metric": 0.9773148148148149,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-finetuned-eurosat/checkpoint-456",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 456,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.06578947368421052,
+      "grad_norm": 20.866443634033203,
+      "learning_rate": 1.0869565217391305e-05,
+      "loss": 9.0721,
+      "step": 10
+    },
+    {
+      "epoch": 0.13157894736842105,
+      "grad_norm": 25.617422103881836,
+      "learning_rate": 2.173913043478261e-05,
+      "loss": 7.9856,
+      "step": 20
+    },
+    {
+      "epoch": 0.19736842105263158,
+      "grad_norm": 34.65253448486328,
+      "learning_rate": 3.260869565217392e-05,
+      "loss": 5.5085,
+      "step": 30
+    },
+    {
+      "epoch": 0.2631578947368421,
+      "grad_norm": 52.107234954833984,
+      "learning_rate": 4.347826086956522e-05,
+      "loss": 2.8542,
+      "step": 40
+    },
+    {
+      "epoch": 0.32894736842105265,
+      "grad_norm": 67.07122802734375,
+      "learning_rate": 4.951219512195122e-05,
+      "loss": 1.9016,
+      "step": 50
+    },
+    {
+      "epoch": 0.39473684210526316,
+      "grad_norm": 37.551544189453125,
+      "learning_rate": 4.829268292682927e-05,
+      "loss": 1.4642,
+      "step": 60
+    },
+    {
+      "epoch": 0.4605263157894737,
+      "grad_norm": 80.52391052246094,
+      "learning_rate": 4.707317073170732e-05,
+      "loss": 1.3269,
+      "step": 70
+    },
+    {
+      "epoch": 0.5263157894736842,
+      "grad_norm": 68.86006927490234,
+      "learning_rate": 4.585365853658537e-05,
+      "loss": 1.3929,
+      "step": 80
+    },
+    {
+      "epoch": 0.5921052631578947,
+      "grad_norm": 66.72190856933594,
+      "learning_rate": 4.4634146341463416e-05,
+      "loss": 1.0898,
+      "step": 90
+    },
+    {
+      "epoch": 0.6578947368421053,
+      "grad_norm": 41.02473068237305,
+      "learning_rate": 4.3414634146341465e-05,
+      "loss": 1.0953,
+      "step": 100
+    },
+    {
+      "epoch": 0.7236842105263158,
+      "grad_norm": 41.78289794921875,
+      "learning_rate": 4.2195121951219514e-05,
+      "loss": 1.0137,
+      "step": 110
+    },
+    {
+      "epoch": 0.7894736842105263,
+      "grad_norm": 45.353145599365234,
+      "learning_rate": 4.097560975609756e-05,
+      "loss": 0.8049,
+      "step": 120
+    },
+    {
+      "epoch": 0.8552631578947368,
+      "grad_norm": 21.81474494934082,
+      "learning_rate": 3.975609756097561e-05,
+      "loss": 0.7485,
+      "step": 130
+    },
+    {
+      "epoch": 0.9210526315789473,
+      "grad_norm": 49.82645797729492,
+      "learning_rate": 3.853658536585366e-05,
+      "loss": 1.0568,
+      "step": 140
+    },
+    {
+      "epoch": 0.9868421052631579,
+      "grad_norm": 41.5629768371582,
+      "learning_rate": 3.731707317073171e-05,
+      "loss": 0.8977,
+      "step": 150
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9652777777777778,
+      "eval_loss": 0.11334270983934402,
+      "eval_runtime": 7.0519,
+      "eval_samples_per_second": 306.299,
+      "eval_steps_per_second": 9.643,
+      "step": 152
+    },
+    {
+      "epoch": 1.0526315789473684,
+      "grad_norm": 43.1265869140625,
+      "learning_rate": 3.609756097560976e-05,
+      "loss": 0.8598,
+      "step": 160
+    },
+    {
+      "epoch": 1.118421052631579,
+      "grad_norm": 27.635250091552734,
+      "learning_rate": 3.48780487804878e-05,
+      "loss": 0.7311,
+      "step": 170
+    },
+    {
+      "epoch": 1.1842105263157894,
+      "grad_norm": 23.846569061279297,
+      "learning_rate": 3.365853658536586e-05,
+      "loss": 0.7527,
+      "step": 180
+    },
+    {
+      "epoch": 1.25,
+      "grad_norm": 38.641170501708984,
+      "learning_rate": 3.2439024390243906e-05,
+      "loss": 0.741,
+      "step": 190
+    },
+    {
+      "epoch": 1.3157894736842106,
+      "grad_norm": 27.279409408569336,
+      "learning_rate": 3.1219512195121955e-05,
+      "loss": 0.8004,
+      "step": 200
+    },
+    {
+      "epoch": 1.381578947368421,
+      "grad_norm": 66.22341918945312,
+      "learning_rate": 3e-05,
+      "loss": 0.8053,
+      "step": 210
+    },
+    {
+      "epoch": 1.4473684210526316,
+      "grad_norm": 47.945037841796875,
+      "learning_rate": 2.8780487804878046e-05,
+      "loss": 0.6861,
+      "step": 220
+    },
+    {
+      "epoch": 1.513157894736842,
+      "grad_norm": 36.4661750793457,
+      "learning_rate": 2.7560975609756102e-05,
+      "loss": 0.7968,
+      "step": 230
+    },
+    {
+      "epoch": 1.5789473684210527,
+      "grad_norm": 37.863529205322266,
+      "learning_rate": 2.6341463414634148e-05,
+      "loss": 0.726,
+      "step": 240
+    },
+    {
+      "epoch": 1.6447368421052633,
+      "grad_norm": 32.88328170776367,
+      "learning_rate": 2.5121951219512197e-05,
+      "loss": 0.5817,
+      "step": 250
+    },
+    {
+      "epoch": 1.7105263157894737,
+      "grad_norm": 33.38253402709961,
+      "learning_rate": 2.3902439024390243e-05,
+      "loss": 0.8163,
+      "step": 260
+    },
+    {
+      "epoch": 1.776315789473684,
+      "grad_norm": 34.18470001220703,
+      "learning_rate": 2.2682926829268295e-05,
+      "loss": 0.61,
+      "step": 270
+    },
+    {
+      "epoch": 1.8421052631578947,
+      "grad_norm": 37.07841491699219,
+      "learning_rate": 2.146341463414634e-05,
+      "loss": 0.6759,
+      "step": 280
+    },
+    {
+      "epoch": 1.9078947368421053,
+      "grad_norm": 38.93689727783203,
+      "learning_rate": 2.0243902439024393e-05,
+      "loss": 0.5962,
+      "step": 290
+    },
+    {
+      "epoch": 1.973684210526316,
+      "grad_norm": 18.049278259277344,
+      "learning_rate": 1.902439024390244e-05,
+      "loss": 0.6553,
+      "step": 300
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9745370370370371,
+      "eval_loss": 0.07717009633779526,
+      "eval_runtime": 7.9404,
+      "eval_samples_per_second": 272.028,
+      "eval_steps_per_second": 8.564,
+      "step": 304
+    },
+    {
+      "epoch": 2.039473684210526,
+      "grad_norm": 23.243087768554688,
+      "learning_rate": 1.7804878048780488e-05,
+      "loss": 0.6486,
+      "step": 310
+    },
+    {
+      "epoch": 2.1052631578947367,
+      "grad_norm": 17.53474998474121,
+      "learning_rate": 1.6585365853658537e-05,
+      "loss": 0.5963,
+      "step": 320
+    },
+    {
+      "epoch": 2.1710526315789473,
+      "grad_norm": 8.011256217956543,
+      "learning_rate": 1.5365853658536586e-05,
+      "loss": 0.5562,
+      "step": 330
+    },
+    {
+      "epoch": 2.236842105263158,
+      "grad_norm": 42.54336929321289,
+      "learning_rate": 1.4146341463414633e-05,
+      "loss": 0.5801,
+      "step": 340
+    },
+    {
+      "epoch": 2.3026315789473686,
+      "grad_norm": 36.78083419799805,
+      "learning_rate": 1.2926829268292684e-05,
+      "loss": 0.5462,
+      "step": 350
+    },
+    {
+      "epoch": 2.3684210526315788,
+      "grad_norm": 33.69931411743164,
+      "learning_rate": 1.1707317073170733e-05,
+      "loss": 0.4258,
+      "step": 360
+    },
+    {
+      "epoch": 2.4342105263157894,
+      "grad_norm": 26.44291877746582,
+      "learning_rate": 1.048780487804878e-05,
+      "loss": 0.6512,
+      "step": 370
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 39.637245178222656,
+      "learning_rate": 9.26829268292683e-06,
+      "loss": 0.5729,
+      "step": 380
+    },
+    {
+      "epoch": 2.5657894736842106,
+      "grad_norm": 45.954925537109375,
+      "learning_rate": 8.048780487804879e-06,
+      "loss": 0.6385,
+      "step": 390
+    },
+    {
+      "epoch": 2.6315789473684212,
+      "grad_norm": 21.456758499145508,
+      "learning_rate": 6.829268292682928e-06,
+      "loss": 0.5242,
+      "step": 400
+    },
+    {
+      "epoch": 2.6973684210526314,
+      "grad_norm": 36.20490646362305,
+      "learning_rate": 5.609756097560976e-06,
+      "loss": 0.6535,
+      "step": 410
+    },
+    {
+      "epoch": 2.763157894736842,
+      "grad_norm": 38.48887634277344,
+      "learning_rate": 4.390243902439024e-06,
+      "loss": 0.4826,
+      "step": 420
+    },
+    {
+      "epoch": 2.8289473684210527,
+      "grad_norm": 18.433237075805664,
+      "learning_rate": 3.1707317073170736e-06,
+      "loss": 0.4697,
+      "step": 430
+    },
+    {
+      "epoch": 2.8947368421052633,
+      "grad_norm": 12.764622688293457,
+      "learning_rate": 1.951219512195122e-06,
+      "loss": 0.5712,
+      "step": 440
+    },
+    {
+      "epoch": 2.9605263157894735,
+      "grad_norm": 34.716705322265625,
+      "learning_rate": 7.317073170731708e-07,
+      "loss": 0.537,
+      "step": 450
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9773148148148149,
+      "eval_loss": 0.06807276606559753,
+      "eval_runtime": 7.8528,
+      "eval_samples_per_second": 275.06,
+      "eval_steps_per_second": 8.659,
+      "step": 456
+    },
+    {
+      "epoch": 3.0,
+      "step": 456,
+      "total_flos": 1.4499253204608614e+18,
+      "train_loss": 1.2673508875202715,
+      "train_runtime": 473.9541,
+      "train_samples_per_second": 123.05,
+      "train_steps_per_second": 0.962
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 456,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.4499253204608614e+18,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}