Training in progress, epoch 2

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff48857e140935905f2d51dd058038971b29df48f11e86540faddcb8cb55788c
 size 236491077

 version https://git-lfs.github.com/spec/v1
+oid sha256:4fe7b93abf02af995010aa8e52e985082cb35427475535754ba46e0f79bfe6b7
 size 236491077

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4803f9e0db327256eb501e38588125bc88c11e1b720f56b57560c04d0edfb58a
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc972ecc1329e0803175ccbf8d455608f73797136d228b25b2d6c64e55403179
 size 118253458

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6704fd65015a992608b80d84ae3a33c9753819f994516e6b0899e5280afdced5
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:9fa70ecb25666f6769a2077ed150c9e52861a4143626716aebc146c3d3d8cd65
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4c55418e1401c7ce23c9d42366610b1a8c2a2596e8b41e0dce8eff0736e359ea
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:27f16da81f42c208591e42d4a624accc6adcfabf4b156667c067c8a5a08012ca
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2eaa85b3feb378678992330dad398ea68e96da3317f4bcf13c1084640b7ec5b
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:c4e814a01103e7d042492e6a27b7700dc34e66d68095fbabd7c929b5bd6b2625
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.0,
-  "global_step": 22940,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -285,11 +285,296 @@
       "eval_samples_per_second": 603.699,
       "eval_steps_per_second": 37.731,
       "step": 22940
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 1.7442453853030272e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.0,
+  "global_step": 45880,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 603.699,
       "eval_steps_per_second": 37.731,
       "step": 22940
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.377822788632103e-05,
+      "loss": 2.1305,
+      "step": 23000
+    },
+    {
+      "epoch": 1.02,
+      "learning_rate": 9.362096946670525e-05,
+      "loss": 2.1245,
+      "step": 23500
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 9.346371104708946e-05,
+      "loss": 2.1178,
+      "step": 24000
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 9.330676714431291e-05,
+      "loss": 2.1102,
+      "step": 24500
+    },
+    {
+      "epoch": 1.09,
+      "learning_rate": 9.314950872469712e-05,
+      "loss": 2.1007,
+      "step": 25000
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 9.299225030508134e-05,
+      "loss": 2.0966,
+      "step": 25500
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 9.283499188546555e-05,
+      "loss": 2.0878,
+      "step": 26000
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 9.2678047982689e-05,
+      "loss": 2.0814,
+      "step": 26500
+    },
+    {
+      "epoch": 1.18,
+      "learning_rate": 9.252078956307321e-05,
+      "loss": 2.0756,
+      "step": 27000
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 9.236353114345743e-05,
+      "loss": 2.0685,
+      "step": 27500
+    },
+    {
+      "epoch": 1.22,
+      "learning_rate": 9.220627272384163e-05,
+      "loss": 2.065,
+      "step": 28000
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 9.204932882106509e-05,
+      "loss": 2.0592,
+      "step": 28500
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 9.18920704014493e-05,
+      "loss": 2.0527,
+      "step": 29000
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 9.173481198183351e-05,
+      "loss": 2.0459,
+      "step": 29500
+    },
+    {
+      "epoch": 1.31,
+      "learning_rate": 9.157755356221772e-05,
+      "loss": 2.0443,
+      "step": 30000
+    },
+    {
+      "epoch": 1.33,
+      "learning_rate": 9.142060965944116e-05,
+      "loss": 2.0367,
+      "step": 30500
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 9.126366575666462e-05,
+      "loss": 2.0322,
+      "step": 31000
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 9.110640733704882e-05,
+      "loss": 2.0228,
+      "step": 31500
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 9.094914891743304e-05,
+      "loss": 2.0209,
+      "step": 32000
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 9.079189049781725e-05,
+      "loss": 2.0156,
+      "step": 32500
+    },
+    {
+      "epoch": 1.44,
+      "learning_rate": 9.063463207820148e-05,
+      "loss": 2.0141,
+      "step": 33000
+    },
+    {
+      "epoch": 1.46,
+      "learning_rate": 9.047737365858569e-05,
+      "loss": 2.0093,
+      "step": 33500
+    },
+    {
+      "epoch": 1.48,
+      "learning_rate": 9.032042975580913e-05,
+      "loss": 2.0052,
+      "step": 34000
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 9.016317133619334e-05,
+      "loss": 1.9973,
+      "step": 34500
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 9.000591291657756e-05,
+      "loss": 1.995,
+      "step": 35000
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 8.984865449696177e-05,
+      "loss": 1.9908,
+      "step": 35500
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 8.969139607734599e-05,
+      "loss": 1.986,
+      "step": 36000
+    },
+    {
+      "epoch": 1.59,
+      "learning_rate": 8.95341376577302e-05,
+      "loss": 1.9825,
+      "step": 36500
+    },
+    {
+      "epoch": 1.61,
+      "learning_rate": 8.937687923811441e-05,
+      "loss": 1.9754,
+      "step": 37000
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 8.921993533533786e-05,
+      "loss": 1.9733,
+      "step": 37500
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 8.906267691572208e-05,
+      "loss": 1.9679,
+      "step": 38000
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 8.890541849610629e-05,
+      "loss": 1.9611,
+      "step": 38500
+    },
+    {
+      "epoch": 1.7,
+      "learning_rate": 8.87481600764905e-05,
+      "loss": 1.961,
+      "step": 39000
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 8.859121617371395e-05,
+      "loss": 1.9588,
+      "step": 39500
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 8.843395775409816e-05,
+      "loss": 1.9578,
+      "step": 40000
+    },
+    {
+      "epoch": 1.77,
+      "learning_rate": 8.827669933448237e-05,
+      "loss": 1.9528,
+      "step": 40500
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 8.811944091486659e-05,
+      "loss": 1.9486,
+      "step": 41000
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 8.796249701209002e-05,
+      "loss": 1.9443,
+      "step": 41500
+    },
+    {
+      "epoch": 1.83,
+      "learning_rate": 8.780523859247425e-05,
+      "loss": 1.9406,
+      "step": 42000
+    },
+    {
+      "epoch": 1.85,
+      "learning_rate": 8.764798017285846e-05,
+      "loss": 1.9372,
+      "step": 42500
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 8.749072175324268e-05,
+      "loss": 1.9351,
+      "step": 43000
+    },
+    {
+      "epoch": 1.9,
+      "learning_rate": 8.733346333362689e-05,
+      "loss": 1.9265,
+      "step": 43500
+    },
+    {
+      "epoch": 1.92,
+      "learning_rate": 8.717651943085034e-05,
+      "loss": 1.9272,
+      "step": 44000
+    },
+    {
+      "epoch": 1.94,
+      "learning_rate": 8.701926101123455e-05,
+      "loss": 1.9268,
+      "step": 44500
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 8.686200259161877e-05,
+      "loss": 1.9242,
+      "step": 45000
+    },
+    {
+      "epoch": 1.98,
+      "learning_rate": 8.670474417200297e-05,
+      "loss": 1.9234,
+      "step": 45500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.6411638490813204,
+      "eval_loss": 1.785447597503662,
+      "eval_runtime": 294.391,
+      "eval_samples_per_second": 604.475,
+      "eval_steps_per_second": 37.78,
+      "step": 45880
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 3.488545026395035e+17,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4803f9e0db327256eb501e38588125bc88c11e1b720f56b57560c04d0edfb58a
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:dc972ecc1329e0803175ccbf8d455608f73797136d228b25b2d6c64e55403179
 size 118253458

runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d78301fc79b73c4bc3a25e318065e0b0fb19b15fc290523ddb23d8d132f535ce
-size 11201

 version https://git-lfs.github.com/spec/v1
+oid sha256:666ec60d0078a18e9ab7268ca3acc069e6bcfd168d1a61b253913169617035c1
+size 18890