Training in progress, step 250000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Jan16_18-15-46_t1v-n-9f780742-w-0/events.out.tfevents.1673893144.t1v-n-9f780742-w-0.17747.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab68cd451356549a4502eec9a272e60fc75231a72b9732fb358ef5b48e873f48
 size 1475917081

 version https://git-lfs.github.com/spec/v1
+oid sha256:1bf6ae7688e7560693a4e4bb3937adfc846238498ea91f5fc36eaf94c7aab612
 size 1475917081

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e755677578f8825f9b73f82b018ef7373fecca69fc0288b9ccfc1971338972c8
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:43a9c6f2be098352ac2fde36032841677d69f338f4448306f8c69c03cfd3bbad
 size 737971755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a455b3e853d6bf9cf5ea5dc97707f031eb21ed38bafc4c70877937c4104c61ce
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b1c862d197db2b0d22e085ebce4b081aa9ac363d653f80d420e7e32502da340
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be1ccf49f4804619cd7d22b74b595a694a368e629a10492b4089d6536d07bdf2
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:7924e9d3f9ed054868d3ddaa60025f26707d231e7eacc5684e8550acfee9e9c0
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "best_metric": null,
  "best_model_checkpoint": null,
- "epoch": 0.2,
- "global_step": 200000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
@@ -1238,11 +1238,319 @@
  "eval_samples_per_second": 58.668,
  "eval_steps_per_second": 0.469,
  "step": 200000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
- "total_flos": 3.3728545947648e+18,
  "trial_name": null,
  "trial_params": null
 }

 {
  "best_metric": null,
  "best_model_checkpoint": null,
+ "epoch": 0.25,
+ "global_step": 250000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "eval_samples_per_second": 58.668,
  "eval_steps_per_second": 0.469,
  "step": 200000
+ },
+ {
+ "epoch": 0.2,
+ "learning_rate": 9.389475079423988e-05,
+ "loss": 0.9764,
+ "step": 201000
+ },
+ {
+ "epoch": 0.2,
+ "learning_rate": 9.381533400219318e-05,
+ "loss": 0.9653,
+ "step": 202000
+ },
+ {
+ "epoch": 0.2,
+ "learning_rate": 9.373543805267368e-05,
+ "loss": 0.9497,
+ "step": 203000
+ },
+ {
+ "epoch": 0.2,
+ "learning_rate": 9.365506381941066e-05,
+ "loss": 0.9411,
+ "step": 204000
+ },
+ {
+ "epoch": 0.2,
+ "learning_rate": 9.357421218136386e-05,
+ "loss": 0.9541,
+ "step": 205000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.349288402271388e-05,
+ "loss": 0.9293,
+ "step": 206000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.341108023285238e-05,
+ "loss": 0.9435,
+ "step": 207000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.332880170637252e-05,
+ "loss": 0.9444,
+ "step": 208000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.32460493430591e-05,
+ "loss": 0.9359,
+ "step": 209000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.316282404787871e-05,
+ "loss": 0.9335,
+ "step": 210000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.30791267309698e-05,
+ "loss": 0.9476,
+ "step": 211000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.299495830763286e-05,
+ "loss": 0.96,
+ "step": 212000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.291031969832026e-05,
+ "loss": 0.9525,
+ "step": 213000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.282521182862629e-05,
+ "loss": 0.9454,
+ "step": 214000
+ },
+ {
+ "epoch": 0.21,
+ "learning_rate": 9.273963562927695e-05,
+ "loss": 0.9233,
+ "step": 215000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.265359203611987e-05,
+ "loss": 0.9461,
+ "step": 216000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.256708199011401e-05,
+ "loss": 0.9495,
+ "step": 217000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.248010643731935e-05,
+ "loss": 0.9339,
+ "step": 218000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.239266632888659e-05,
+ "loss": 0.9535,
+ "step": 219000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.230476262104677e-05,
+ "loss": 0.9589,
+ "step": 220000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.221639627510076e-05,
+ "loss": 0.9387,
+ "step": 221000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.212756825740873e-05,
+ "loss": 0.9407,
+ "step": 222000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.20382795393797e-05,
+ "loss": 0.9195,
+ "step": 223000
+ },
+ {
+ "epoch": 0.22,
+ "learning_rate": 9.194853109746074e-05,
+ "loss": 0.9329,
+ "step": 224000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.185832391312644e-05,
+ "loss": 0.919,
+ "step": 225000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.176765897286813e-05,
+ "loss": 0.8879,
+ "step": 226000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.167653726818305e-05,
+ "loss": 0.8842,
+ "step": 227000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.158495979556358e-05,
+ "loss": 0.9301,
+ "step": 228000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.14929275564863e-05,
+ "loss": 0.9398,
+ "step": 229000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.140044155740101e-05,
+ "loss": 0.9182,
+ "step": 230000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.130750280971978e-05,
+ "loss": 0.9257,
+ "step": 231000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.121411232980588e-05,
+ "loss": 0.9048,
+ "step": 232000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.112027113896262e-05,
+ "loss": 0.9366,
+ "step": 233000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.102598026342222e-05,
+ "loss": 0.9115,
+ "step": 234000
+ },
+ {
+ "epoch": 0.23,
+ "learning_rate": 9.093124073433463e-05,
+ "loss": 0.9433,
+ "step": 235000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.083605358775612e-05,
+ "loss": 0.9183,
+ "step": 236000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.074041986463808e-05,
+ "loss": 0.9346,
+ "step": 237000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.064434061081562e-05,
+ "loss": 0.9286,
+ "step": 238000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.0547816876996e-05,
+ "loss": 0.9147,
+ "step": 239000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.045084971874738e-05,
+ "loss": 0.9474,
+ "step": 240000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.035344019648702e-05,
+ "loss": 0.94,
+ "step": 241000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.025558937546988e-05,
+ "loss": 0.9406,
+ "step": 242000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.015729832577681e-05,
+ "loss": 0.9375,
+ "step": 243000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 9.005856812230304e-05,
+ "loss": 0.9369,
+ "step": 244000
+ },
+ {
+ "epoch": 0.24,
+ "learning_rate": 8.995939984474624e-05,
+ "loss": 0.9336,
+ "step": 245000
+ },
+ {
+ "epoch": 0.25,
+ "learning_rate": 8.98597945775948e-05,
+ "loss": 0.9271,
+ "step": 246000
+ },
+ {
+ "epoch": 0.25,
+ "learning_rate": 8.975975341011596e-05,
+ "loss": 0.908,
+ "step": 247000
+ },
+ {
+ "epoch": 0.25,
+ "learning_rate": 8.965927743634391e-05,
+ "loss": 0.8966,
+ "step": 248000
+ },
+ {
+ "epoch": 0.25,
+ "learning_rate": 8.955836775506776e-05,
+ "loss": 0.908,
+ "step": 249000
+ },
+ {
+ "epoch": 0.25,
+ "learning_rate": 8.945702546981969e-05,
+ "loss": 0.8949,
+ "step": 250000
+ },
+ {
+ "epoch": 0.25,
+ "eval_loss": 0.6713926792144775,
+ "eval_runtime": 92.5228,
+ "eval_samples_per_second": 54.041,
+ "eval_steps_per_second": 0.432,
+ "step": 250000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
+ "total_flos": 4.216068243456e+18,
  "trial_name": null,
  "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e755677578f8825f9b73f82b018ef7373fecca69fc0288b9ccfc1971338972c8
 size 737971755

 version https://git-lfs.github.com/spec/v1
+oid sha256:43a9c6f2be098352ac2fde36032841677d69f338f4448306f8c69c03cfd3bbad
 size 737971755

runs/Jan16_18-15-46_t1v-n-9f780742-w-0/events.out.tfevents.1673893144.t1v-n-9f780742-w-0.17747.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5d27d4c50d44b13a77ae6d5a30638d62d77a3339efdecff2d734e11e10fd6128
-size 36818

 version https://git-lfs.github.com/spec/v1
+oid sha256:581167baa1668613b355b5c274e767c15a75727948234ba6acb3b7e3893fdf17
+size 45094