Training in progress, epoch 5

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5ef39ac23e005dc178e9ef1a544aa5b8f96467e8469680a8607d2d7347b1ee53
 size 236491269

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c89b45e2ac69f6293669df6313ee21058cc2af394a4390bba808d002466ccd2
 size 236491269

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2079a756a8358ae3a535c523dc50111795059680977ed08b4832ffbac8ef5fc
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:6862122e6b9f883fcb720027b7e6e1ee4be3dcf9522d8dc9475125e601d5bc53
 size 118253458

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8af9d4596051180f9613336aed3a4246c78a50ebaf3faba7d98ece3fdb0a943a
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:3214d2294320f690f0de7c994db816bb6b393e81c203b4bd95ac5070d6787ff6
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ccbda19fc21cde44b0ae7a422108e69de01877a51e50220752bf822b9a78b1f9
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:274b42d0611ce03f64f3695a4574be0aa6d9ba137add81127f546ea0347ddbe2
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5962a4375a7ac9a133f1b777607905c970b63f4d098090eca341092be76e05b
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e06a18a940ba98c5f1a42737f61af8460d78a917521a83b1e094435306c8218
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 4.0,
-  "global_step": 91760,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1140,11 +1140,296 @@
       "eval_samples_per_second": 604.307,
       "eval_steps_per_second": 37.769,
       "step": 91760
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 6.9770786168245e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 5.0,
+  "global_step": 114700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 604.307,
       "eval_steps_per_second": 37.769,
       "step": 91760
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 7.208694503503718e-05,
+      "loss": 1.7576,
+      "step": 92000
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 7.193000113226062e-05,
+      "loss": 1.7556,
+      "step": 92500
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 7.177274271264483e-05,
+      "loss": 1.7484,
+      "step": 93000
+    },
+    {
+      "epoch": 4.08,
+      "learning_rate": 7.161548429302906e-05,
+      "loss": 1.7533,
+      "step": 93500
+    },
+    {
+      "epoch": 4.1,
+      "learning_rate": 7.145822587341327e-05,
+      "loss": 1.7508,
+      "step": 94000
+    },
+    {
+      "epoch": 4.12,
+      "learning_rate": 7.130128197063671e-05,
+      "loss": 1.7589,
+      "step": 94500
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 7.114402355102092e-05,
+      "loss": 1.7485,
+      "step": 95000
+    },
+    {
+      "epoch": 4.16,
+      "learning_rate": 7.098676513140515e-05,
+      "loss": 1.7477,
+      "step": 95500
+    },
+    {
+      "epoch": 4.18,
+      "learning_rate": 7.082950671178934e-05,
+      "loss": 1.7523,
+      "step": 96000
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 7.06725628090128e-05,
+      "loss": 1.7443,
+      "step": 96500
+    },
+    {
+      "epoch": 4.23,
+      "learning_rate": 7.051530438939701e-05,
+      "loss": 1.7481,
+      "step": 97000
+    },
+    {
+      "epoch": 4.25,
+      "learning_rate": 7.035804596978122e-05,
+      "loss": 1.7421,
+      "step": 97500
+    },
+    {
+      "epoch": 4.27,
+      "learning_rate": 7.020078755016543e-05,
+      "loss": 1.7449,
+      "step": 98000
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 7.004384364738888e-05,
+      "loss": 1.7453,
+      "step": 98500
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 6.988658522777309e-05,
+      "loss": 1.7443,
+      "step": 99000
+    },
+    {
+      "epoch": 4.34,
+      "learning_rate": 6.972932680815731e-05,
+      "loss": 1.7398,
+      "step": 99500
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 6.957206838854152e-05,
+      "loss": 1.7387,
+      "step": 100000
+    },
+    {
+      "epoch": 4.38,
+      "learning_rate": 6.941512448576497e-05,
+      "loss": 1.7398,
+      "step": 100500
+    },
+    {
+      "epoch": 4.4,
+      "learning_rate": 6.925786606614918e-05,
+      "loss": 1.7383,
+      "step": 101000
+    },
+    {
+      "epoch": 4.42,
+      "learning_rate": 6.91006076465334e-05,
+      "loss": 1.7379,
+      "step": 101500
+    },
+    {
+      "epoch": 4.45,
+      "learning_rate": 6.894334922691761e-05,
+      "loss": 1.7365,
+      "step": 102000
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 6.878640532414106e-05,
+      "loss": 1.7372,
+      "step": 102500
+    },
+    {
+      "epoch": 4.49,
+      "learning_rate": 6.862914690452527e-05,
+      "loss": 1.7336,
+      "step": 103000
+    },
+    {
+      "epoch": 4.51,
+      "learning_rate": 6.847188848490948e-05,
+      "loss": 1.7379,
+      "step": 103500
+    },
+    {
+      "epoch": 4.53,
+      "learning_rate": 6.831463006529369e-05,
+      "loss": 1.7325,
+      "step": 104000
+    },
+    {
+      "epoch": 4.56,
+      "learning_rate": 6.815768616251714e-05,
+      "loss": 1.7329,
+      "step": 104500
+    },
+    {
+      "epoch": 4.58,
+      "learning_rate": 6.800042774290136e-05,
+      "loss": 1.7335,
+      "step": 105000
+    },
+    {
+      "epoch": 4.6,
+      "learning_rate": 6.784316932328557e-05,
+      "loss": 1.7347,
+      "step": 105500
+    },
+    {
+      "epoch": 4.62,
+      "learning_rate": 6.768591090366978e-05,
+      "loss": 1.7293,
+      "step": 106000
+    },
+    {
+      "epoch": 4.64,
+      "learning_rate": 6.752896700089323e-05,
+      "loss": 1.7307,
+      "step": 106500
+    },
+    {
+      "epoch": 4.66,
+      "learning_rate": 6.737170858127745e-05,
+      "loss": 1.7264,
+      "step": 107000
+    },
+    {
+      "epoch": 4.69,
+      "learning_rate": 6.721445016166166e-05,
+      "loss": 1.7294,
+      "step": 107500
+    },
+    {
+      "epoch": 4.71,
+      "learning_rate": 6.705719174204587e-05,
+      "loss": 1.7324,
+      "step": 108000
+    },
+    {
+      "epoch": 4.73,
+      "learning_rate": 6.690024783926932e-05,
+      "loss": 1.7279,
+      "step": 108500
+    },
+    {
+      "epoch": 4.75,
+      "learning_rate": 6.674298941965354e-05,
+      "loss": 1.7228,
+      "step": 109000
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 6.658573100003774e-05,
+      "loss": 1.7248,
+      "step": 109500
+    },
+    {
+      "epoch": 4.8,
+      "learning_rate": 6.642847258042196e-05,
+      "loss": 1.7278,
+      "step": 110000
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 6.62715286776454e-05,
+      "loss": 1.7211,
+      "step": 110500
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 6.611427025802962e-05,
+      "loss": 1.7227,
+      "step": 111000
+    },
+    {
+      "epoch": 4.86,
+      "learning_rate": 6.595701183841383e-05,
+      "loss": 1.7181,
+      "step": 111500
+    },
+    {
+      "epoch": 4.88,
+      "learning_rate": 6.579975341879805e-05,
+      "loss": 1.7188,
+      "step": 112000
+    },
+    {
+      "epoch": 4.9,
+      "learning_rate": 6.564280951602148e-05,
+      "loss": 1.7169,
+      "step": 112500
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 6.54855510964057e-05,
+      "loss": 1.7186,
+      "step": 113000
+    },
+    {
+      "epoch": 4.95,
+      "learning_rate": 6.532829267678992e-05,
+      "loss": 1.7199,
+      "step": 113500
+    },
+    {
+      "epoch": 4.97,
+      "learning_rate": 6.517103425717414e-05,
+      "loss": 1.7216,
+      "step": 114000
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 6.501409035439757e-05,
+      "loss": 1.7173,
+      "step": 114500
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6715102448572298,
+      "eval_loss": 1.5880473852157593,
+      "eval_runtime": 294.7287,
+      "eval_samples_per_second": 603.782,
+      "eval_steps_per_second": 37.736,
+      "step": 114700
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 8.721147965075726e+17,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2079a756a8358ae3a535c523dc50111795059680977ed08b4832ffbac8ef5fc
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:6862122e6b9f883fcb720027b7e6e1ee4be3dcf9522d8dc9475125e601d5bc53
 size 118253458

runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c61cb2a0b744c6498ef70bdac9f8c45f62963b3650e88b2e9078f86270e723f
-size 34268

 version https://git-lfs.github.com/spec/v1
+oid sha256:87287f5853697bd232c1d288f5654c67eba5514d42ef65d845face5a9d732001
+size 41957