Training in progress, step 650000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Apr11_08-45-40_t1v-n-fb892c44-w-0/events.out.tfevents.1681202915.t1v-n-fb892c44-w-0.3296147.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8bd41ff916c8c6deb64f4d28541da86354be2003b9ea48b57f6d7f2714abdb36
 size 885325017

 version https://git-lfs.github.com/spec/v1
+oid sha256:0d202792991b0718897d7f2d7a35b19d446d4ace5ca99b89ec4f911974c670f5
 size 885325017

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5046706608bcda4976fae1fee645d8df2e6e61edeab7be18507d061a5901fffa
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ecc9d57bd3dc670008b32551176e1f45f83965bd1406b07859fe74370f6361f
 size 442675755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc55cccc4c1e96b4c5a9789942484f4ac3e1188c3cddbb3d5829ea586feedf08
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4c619563b1b5ff7d065a709f6e5a3b568a862ef83e1739fa24fd5d8516b5650
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6bf3a5bf3b7ffd795604bcb9290b5668512cab2d92ca9f4ff81b8b3c38e0f
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:92cc2e864d6b6789a7120c17daa517da2dd18f973b279cb691cc326e927c894d
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6bf3a5bf3b7ffd795604bcb9290b5668512cab2d92ca9f4ff81b8b3c38e0f
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:92cc2e864d6b6789a7120c17daa517da2dd18f973b279cb691cc326e927c894d
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6bf3a5bf3b7ffd795604bcb9290b5668512cab2d92ca9f4ff81b8b3c38e0f
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:92cc2e864d6b6789a7120c17daa517da2dd18f973b279cb691cc326e927c894d
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc55cccc4c1e96b4c5a9789942484f4ac3e1188c3cddbb3d5829ea586feedf08
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4c619563b1b5ff7d065a709f6e5a3b568a862ef83e1739fa24fd5d8516b5650
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc55cccc4c1e96b4c5a9789942484f4ac3e1188c3cddbb3d5829ea586feedf08
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b4c619563b1b5ff7d065a709f6e5a3b568a862ef83e1739fa24fd5d8516b5650
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6bf3a5bf3b7ffd795604bcb9290b5668512cab2d92ca9f4ff81b8b3c38e0f
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:92cc2e864d6b6789a7120c17daa517da2dd18f973b279cb691cc326e927c894d
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8f6bf3a5bf3b7ffd795604bcb9290b5668512cab2d92ca9f4ff81b8b3c38e0f
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:92cc2e864d6b6789a7120c17daa517da2dd18f973b279cb691cc326e927c894d
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f595742cd0d96240559aaf1ff72fa8686f62da9f07c5878ab2af30ab1e4f0a07
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d7fa20411577666fac76fe76348b4f9231439cc2e524d6e3185910c258591e9
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "best_metric": null,
  "best_model_checkpoint": null,
- "epoch": 8.018797,
- "global_step": 600000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
@@ -3702,11 +3702,319 @@
  "eval_samples_per_second": 430.064,
  "eval_steps_per_second": 3.441,
  "step": 600000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
- "total_flos": 1.0107302333739172e+19,
  "trial_name": null,
  "trial_params": null
 }

 {
  "best_metric": null,
  "best_model_checkpoint": null,
+ "epoch": 8.068797,
+ "global_step": 650000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "eval_samples_per_second": 430.064,
  "eval_steps_per_second": 3.441,
  "step": 600000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.756550564175727e-05,
+ "loss": 0.519,
+ "step": 601000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.74054216221926e-05,
+ "loss": 0.5482,
+ "step": 602000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.7245475334919246e-05,
+ "loss": 0.5494,
+ "step": 603000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.7085668529084184e-05,
+ "loss": 0.4997,
+ "step": 604000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.6926002952309016e-05,
+ "loss": 0.5099,
+ "step": 605000
+ },
+ {
+ "epoch": 8.02,
+ "learning_rate": 3.676648035067093e-05,
+ "loss": 0.5419,
+ "step": 606000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.6607102468683526e-05,
+ "loss": 0.5449,
+ "step": 607000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.6447871049277796e-05,
+ "loss": 0.5013,
+ "step": 608000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.628878783378302e-05,
+ "loss": 0.5281,
+ "step": 609000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.612985456190778e-05,
+ "loss": 0.5642,
+ "step": 610000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.597107297172084e-05,
+ "loss": 0.5595,
+ "step": 611000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.581244479963225e-05,
+ "loss": 0.5097,
+ "step": 612000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.5653971780374295e-05,
+ "loss": 0.5268,
+ "step": 613000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.5495655646982505e-05,
+ "loss": 0.5581,
+ "step": 614000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.533749813077677e-05,
+ "loss": 0.5494,
+ "step": 615000
+ },
+ {
+ "epoch": 8.03,
+ "learning_rate": 3.517950096134232e-05,
+ "loss": 0.5017,
+ "step": 616000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.5021665866510925e-05,
+ "loss": 0.5123,
+ "step": 617000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.4863994572341843e-05,
+ "loss": 0.5513,
+ "step": 618000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.470648880310313e-05,
+ "loss": 0.548,
+ "step": 619000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.4549150281252636e-05,
+ "loss": 0.5005,
+ "step": 620000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.439198072741921e-05,
+ "loss": 0.5132,
+ "step": 621000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.423498186038393e-05,
+ "loss": 0.5489,
+ "step": 622000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.407815539706124e-05,
+ "loss": 0.5364,
+ "step": 623000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.392150305248024e-05,
+ "loss": 0.5226,
+ "step": 624000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.3765026539765834e-05,
+ "loss": 0.513,
+ "step": 625000
+ },
+ {
+ "epoch": 8.04,
+ "learning_rate": 3.360872757012011e-05,
+ "loss": 0.5467,
+ "step": 626000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.3452607852803584e-05,
+ "loss": 0.5699,
+ "step": 627000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.329666909511645e-05,
+ "loss": 0.5162,
+ "step": 628000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.3140913002379995e-05,
+ "loss": 0.53,
+ "step": 629000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.298534127791785e-05,
+ "loss": 0.5628,
+ "step": 630000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.282995562303754e-05,
+ "loss": 0.5446,
+ "step": 631000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.267475773701161e-05,
+ "loss": 0.5014,
+ "step": 632000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.251974931705933e-05,
+ "loss": 0.5095,
+ "step": 633000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.236493205832795e-05,
+ "loss": 0.5348,
+ "step": 634000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.221030765387417e-05,
+ "loss": 0.5256,
+ "step": 635000
+ },
+ {
+ "epoch": 8.05,
+ "learning_rate": 3.205587779464576e-05,
+ "loss": 0.4785,
+ "step": 636000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.190164416946285e-05,
+ "loss": 0.5139,
+ "step": 637000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.1747608464999725e-05,
+ "loss": 0.5512,
+ "step": 638000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.1593772365766105e-05,
+ "loss": 0.5349,
+ "step": 639000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.144013755408895e-05,
+ "loss": 0.4793,
+ "step": 640000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.128670571009399e-05,
+ "loss": 0.4884,
+ "step": 641000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.113347851168721e-05,
+ "loss": 0.5823,
+ "step": 642000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.098045763453678e-05,
+ "loss": 0.5262,
+ "step": 643000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.082764475205442e-05,
+ "loss": 0.496,
+ "step": 644000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.0675041535377405e-05,
+ "loss": 0.5083,
+ "step": 645000
+ },
+ {
+ "epoch": 8.06,
+ "learning_rate": 3.052264965335e-05,
+ "loss": 0.5435,
+ "step": 646000
+ },
+ {
+ "epoch": 8.07,
+ "learning_rate": 3.0370470772505433e-05,
+ "loss": 0.5317,
+ "step": 647000
+ },
+ {
+ "epoch": 8.07,
+ "learning_rate": 3.0218506557047598e-05,
+ "loss": 0.4747,
+ "step": 648000
+ },
+ {
+ "epoch": 8.07,
+ "learning_rate": 3.006675866883275e-05,
+ "loss": 0.4831,
+ "step": 649000
+ },
+ {
+ "epoch": 8.07,
+ "learning_rate": 2.991522876735154e-05,
+ "loss": 0.5174,
+ "step": 650000
+ },
+ {
+ "epoch": 8.07,
+ "eval_loss": 0.4389691948890686,
+ "eval_runtime": 12.6443,
+ "eval_samples_per_second": 395.436,
+ "eval_steps_per_second": 3.163,
+ "step": 650000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
+ "total_flos": 1.0949572264030372e+19,
  "trial_name": null,
  "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5046706608bcda4976fae1fee645d8df2e6e61edeab7be18507d061a5901fffa
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ecc9d57bd3dc670008b32551176e1f45f83965bd1406b07859fe74370f6361f
 size 442675755

runs/Apr11_08-45-40_t1v-n-fb892c44-w-0/events.out.tfevents.1681202915.t1v-n-fb892c44-w-0.3296147.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:051c6a6a9d523c855791fe5286f4cd3388622f03f881576e0da57c6f77a8e22d
-size 78333

 version https://git-lfs.github.com/spec/v1
+oid sha256:33bf5605db375fa3270a2956aafe54f5d828cff7de0a5bf921b4936a2b1f8294
+size 86609