Training in progress, epoch 3

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +2 -2
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4fe7b93abf02af995010aa8e52e985082cb35427475535754ba46e0f79bfe6b7
-size 236491077

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ad3d537ea4fd7d6ad4fa6cf73b1b40dd110b483d065f2705e6949affdc6cf17
+size 236491269

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dc972ecc1329e0803175ccbf8d455608f73797136d228b25b2d6c64e55403179
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:2906e434c2be5553d8ba690fa00f38995006c684a8b4fbef8476c7418f239877
 size 118253458

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9fa70ecb25666f6769a2077ed150c9e52861a4143626716aebc146c3d3d8cd65
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:fddd988ead107be498ca0838e5d6931249bb674b40ce6296875748270d271cc4
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27f16da81f42c208591e42d4a624accc6adcfabf4b156667c067c8a5a08012ca
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:45ac1a1a1f98b3964d76c33e861170daff6e880017ea91dcfeb6f1af152554e5
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c4e814a01103e7d042492e6a27b7700dc34e66d68095fbabd7c929b5bd6b2625
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:29cf36739c6a6691ce7e0e701bc722960d20ddd1e069bdfc942253c223daa611
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 2.0,
-  "global_step": 45880,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -570,11 +570,296 @@
       "eval_samples_per_second": 604.475,
       "eval_steps_per_second": 37.78,
       "step": 45880
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 3.488545026395035e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 68820,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 604.475,
       "eval_steps_per_second": 37.78,
       "step": 45880
+    },
+    {
+      "epoch": 2.01,
+      "learning_rate": 8.654780026922643e-05,
+      "loss": 1.9157,
+      "step": 46000
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 8.639054184961062e-05,
+      "loss": 1.9106,
+      "step": 46500
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 8.623328342999485e-05,
+      "loss": 1.9071,
+      "step": 47000
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 8.607602501037906e-05,
+      "loss": 1.9029,
+      "step": 47500
+    },
+    {
+      "epoch": 2.09,
+      "learning_rate": 8.59190811076025e-05,
+      "loss": 1.9037,
+      "step": 48000
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 8.576182268798671e-05,
+      "loss": 1.9035,
+      "step": 48500
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 8.560456426837094e-05,
+      "loss": 1.8995,
+      "step": 49000
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 8.544730584875515e-05,
+      "loss": 1.8955,
+      "step": 49500
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 8.529036194597859e-05,
+      "loss": 1.894,
+      "step": 50000
+    },
+    {
+      "epoch": 2.2,
+      "learning_rate": 8.51331035263628e-05,
+      "loss": 1.8871,
+      "step": 50500
+    },
+    {
+      "epoch": 2.22,
+      "learning_rate": 8.497584510674703e-05,
+      "loss": 1.8897,
+      "step": 51000
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 8.481858668713124e-05,
+      "loss": 1.888,
+      "step": 51500
+    },
+    {
+      "epoch": 2.27,
+      "learning_rate": 8.466164278435468e-05,
+      "loss": 1.8866,
+      "step": 52000
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 8.450438436473889e-05,
+      "loss": 1.8829,
+      "step": 52500
+    },
+    {
+      "epoch": 2.31,
+      "learning_rate": 8.43471259451231e-05,
+      "loss": 1.8787,
+      "step": 53000
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 8.418986752550731e-05,
+      "loss": 1.8743,
+      "step": 53500
+    },
+    {
+      "epoch": 2.35,
+      "learning_rate": 8.403260910589154e-05,
+      "loss": 1.8758,
+      "step": 54000
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 8.387566520311498e-05,
+      "loss": 1.8728,
+      "step": 54500
+    },
+    {
+      "epoch": 2.4,
+      "learning_rate": 8.371840678349919e-05,
+      "loss": 1.8713,
+      "step": 55000
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 8.35611483638834e-05,
+      "loss": 1.8675,
+      "step": 55500
+    },
+    {
+      "epoch": 2.44,
+      "learning_rate": 8.340388994426763e-05,
+      "loss": 1.8653,
+      "step": 56000
+    },
+    {
+      "epoch": 2.46,
+      "learning_rate": 8.324694604149107e-05,
+      "loss": 1.8635,
+      "step": 56500
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 8.308968762187528e-05,
+      "loss": 1.8589,
+      "step": 57000
+    },
+    {
+      "epoch": 2.51,
+      "learning_rate": 8.293242920225949e-05,
+      "loss": 1.8585,
+      "step": 57500
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 8.27751707826437e-05,
+      "loss": 1.8592,
+      "step": 58000
+    },
+    {
+      "epoch": 2.55,
+      "learning_rate": 8.261822687986716e-05,
+      "loss": 1.8551,
+      "step": 58500
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 8.246096846025136e-05,
+      "loss": 1.8564,
+      "step": 59000
+    },
+    {
+      "epoch": 2.59,
+      "learning_rate": 8.230371004063558e-05,
+      "loss": 1.851,
+      "step": 59500
+    },
+    {
+      "epoch": 2.62,
+      "learning_rate": 8.214645162101979e-05,
+      "loss": 1.8469,
+      "step": 60000
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 8.198950771824324e-05,
+      "loss": 1.8461,
+      "step": 60500
+    },
+    {
+      "epoch": 2.66,
+      "learning_rate": 8.183224929862745e-05,
+      "loss": 1.8487,
+      "step": 61000
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 8.167499087901167e-05,
+      "loss": 1.8435,
+      "step": 61500
+    },
+    {
+      "epoch": 2.7,
+      "learning_rate": 8.151773245939588e-05,
+      "loss": 1.8403,
+      "step": 62000
+    },
+    {
+      "epoch": 2.72,
+      "learning_rate": 8.136078855661933e-05,
+      "loss": 1.8435,
+      "step": 62500
+    },
+    {
+      "epoch": 2.75,
+      "learning_rate": 8.120353013700354e-05,
+      "loss": 1.8409,
+      "step": 63000
+    },
+    {
+      "epoch": 2.77,
+      "learning_rate": 8.104627171738776e-05,
+      "loss": 1.8359,
+      "step": 63500
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 8.088901329777196e-05,
+      "loss": 1.833,
+      "step": 64000
+    },
+    {
+      "epoch": 2.81,
+      "learning_rate": 8.073206939499542e-05,
+      "loss": 1.8336,
+      "step": 64500
+    },
+    {
+      "epoch": 2.83,
+      "learning_rate": 8.057481097537963e-05,
+      "loss": 1.8348,
+      "step": 65000
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 8.041755255576384e-05,
+      "loss": 1.8302,
+      "step": 65500
+    },
+    {
+      "epoch": 2.88,
+      "learning_rate": 8.026029413614805e-05,
+      "loss": 1.8253,
+      "step": 66000
+    },
+    {
+      "epoch": 2.9,
+      "learning_rate": 8.01033502333715e-05,
+      "loss": 1.8225,
+      "step": 66500
+    },
+    {
+      "epoch": 2.92,
+      "learning_rate": 7.99460918137557e-05,
+      "loss": 1.8245,
+      "step": 67000
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 7.978883339413993e-05,
+      "loss": 1.8246,
+      "step": 67500
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 7.963157497452414e-05,
+      "loss": 1.8203,
+      "step": 68000
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 7.947463107174758e-05,
+      "loss": 1.8178,
+      "step": 68500
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6562844667040338,
+      "eval_loss": 1.6895612478256226,
+      "eval_runtime": 294.9578,
+      "eval_samples_per_second": 603.314,
+      "eval_steps_per_second": 37.707,
+      "step": 68820
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 5.2328760513448845e+17,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dc972ecc1329e0803175ccbf8d455608f73797136d228b25b2d6c64e55403179
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:2906e434c2be5553d8ba690fa00f38995006c684a8b4fbef8476c7418f239877
 size 118253458

runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:666ec60d0078a18e9ab7268ca3acc069e6bcfd168d1a61b253913169617035c1
-size 18890

 version https://git-lfs.github.com/spec/v1
+oid sha256:7bf4c282d434ce5ba540303c16207d3c8f5d389184c1a3bbf4dd4df23675b929
+size 26579