Training in progress, step 900000

Browse files

Files changed (14) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
pytorch_model.bin +1 -1
runs/Apr11_08-45-40_t1v-n-fb892c44-w-0/events.out.tfevents.1681202915.t1v-n-fb892c44-w-0.3296147.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9ced13f9fe1c6abb065f1454d1dfe3a3851a905572b70da9e3a5f2e82f447517
 size 885325017

 version https://git-lfs.github.com/spec/v1
+oid sha256:7be3c63a7db355df0c16f44b3a84ae1827088c374b677acc161d3c118059df7f
 size 885325017

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c06640eca11b1304ee4e8f12cf7b6eaef37faaf4e6e12f436d38316a0500c5fe
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:094ffaaef6861196b82664bedfc2e8503866ca513e71d6cb3ec80b0579b21580
 size 442675755

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51584d101168558d08938c91c664aa455798605c22e29a39ce52d5cec5946e57
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:77efe9cf27bf75190b7c4227ba2b681a2bb5fd8a8adef3d6ef4ecedcdb622b56
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa3a3ff1bbe510ea64c418f0f4b7ae4ff637b2f675aa7327308814422c14671
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b90e0a0db0e7b32645a0ce271a721bd086ca63e926689a7c41527f798e0a2045
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa3a3ff1bbe510ea64c418f0f4b7ae4ff637b2f675aa7327308814422c14671
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b90e0a0db0e7b32645a0ce271a721bd086ca63e926689a7c41527f798e0a2045
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa3a3ff1bbe510ea64c418f0f4b7ae4ff637b2f675aa7327308814422c14671
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b90e0a0db0e7b32645a0ce271a721bd086ca63e926689a7c41527f798e0a2045
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51584d101168558d08938c91c664aa455798605c22e29a39ce52d5cec5946e57
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:77efe9cf27bf75190b7c4227ba2b681a2bb5fd8a8adef3d6ef4ecedcdb622b56
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51584d101168558d08938c91c664aa455798605c22e29a39ce52d5cec5946e57
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:77efe9cf27bf75190b7c4227ba2b681a2bb5fd8a8adef3d6ef4ecedcdb622b56
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa3a3ff1bbe510ea64c418f0f4b7ae4ff637b2f675aa7327308814422c14671
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b90e0a0db0e7b32645a0ce271a721bd086ca63e926689a7c41527f798e0a2045
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cfa3a3ff1bbe510ea64c418f0f4b7ae4ff637b2f675aa7327308814422c14671
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:b90e0a0db0e7b32645a0ce271a721bd086ca63e926689a7c41527f798e0a2045
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:adedebe0cc7e07de957a9e2967d6e9c3934a9fdca3245f46a29d125e5e36192e
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:98fbf159ce1bb90afdab5d6ac994b4ab633fc21d8eb6c04c41c7f3a26253e5b5
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "best_metric": null,
  "best_model_checkpoint": null,
- "epoch": 11.044322,
- "global_step": 850000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
@@ -5242,11 +5242,319 @@
  "eval_samples_per_second": 71.459,
  "eval_steps_per_second": 0.572,
  "step": 850000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
- "total_flos": 1.431867725329308e+19,
  "trial_name": null,
  "trial_params": null
 }

 {
  "best_metric": null,
  "best_model_checkpoint": null,
+ "epoch": 12.019497,
+ "global_step": 900000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "eval_samples_per_second": 71.459,
  "eval_steps_per_second": 0.572,
  "step": 850000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.947856562792925e-06,
+ "loss": 0.5579,
+ "step": 851000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.869882433093155e-06,
+ "loss": 0.5342,
+ "step": 852000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.79239090328883e-06,
+ "loss": 0.4915,
+ "step": 853000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.715382820814885e-06,
+ "loss": 0.5185,
+ "step": 854000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.6388590278194096e-06,
+ "loss": 0.5439,
+ "step": 855000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.562820361154314e-06,
+ "loss": 0.5144,
+ "step": 856000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.48726765236629e-06,
+ "loss": 0.4734,
+ "step": 857000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.412201727687644e-06,
+ "loss": 0.491,
+ "step": 858000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.337623408027293e-06,
+ "loss": 0.5233,
+ "step": 859000
+ },
+ {
+ "epoch": 11.05,
+ "learning_rate": 5.263533508961827e-06,
+ "loss": 0.4936,
+ "step": 860000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 5.1899328407264855e-06,
+ "loss": 0.4585,
+ "step": 861000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 5.116822208206396e-06,
+ "loss": 0.5104,
+ "step": 862000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 5.044202410927706e-06,
+ "loss": 0.5342,
+ "step": 863000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.972074243048897e-06,
+ "loss": 0.4968,
+ "step": 864000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.900438493352055e-06,
+ "loss": 0.4527,
+ "step": 865000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.829295945234258e-06,
+ "loss": 0.5301,
+ "step": 866000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.758647376699032e-06,
+ "loss": 0.5213,
+ "step": 867000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.688493560347773e-06,
+ "loss": 0.5033,
+ "step": 868000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.618835263371396e-06,
+ "loss": 0.4709,
+ "step": 869000
+ },
+ {
+ "epoch": 11.06,
+ "learning_rate": 4.549673247541875e-06,
+ "loss": 0.4998,
+ "step": 870000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.48100826920394e-06,
+ "loss": 0.5318,
+ "step": 871000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.412841079266777e-06,
+ "loss": 0.4929,
+ "step": 872000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.3451724231958644e-06,
+ "loss": 0.4505,
+ "step": 873000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.27800304100478e-06,
+ "loss": 0.4804,
+ "step": 874000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.2113336672471245e-06,
+ "loss": 0.5057,
+ "step": 875000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.145165031008508e-06,
+ "loss": 0.4685,
+ "step": 876000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.079497855898501e-06,
+ "loss": 0.4303,
+ "step": 877000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 4.01433286004283e-06,
+ "loss": 0.46,
+ "step": 878000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 3.949670756075447e-06,
+ "loss": 0.5197,
+ "step": 879000
+ },
+ {
+ "epoch": 11.07,
+ "learning_rate": 3.885512251130763e-06,
+ "loss": 0.4886,
+ "step": 880000
+ },
+ {
+ "epoch": 12.0,
+ "learning_rate": 3.821858046835913e-06,
+ "loss": 0.4545,
+ "step": 881000
+ },
+ {
+ "epoch": 12.0,
+ "learning_rate": 3.75870883930306e-06,
+ "loss": 0.4543,
+ "step": 882000
+ },
+ {
+ "epoch": 12.0,
+ "learning_rate": 3.696065319121833e-06,
+ "loss": 0.4902,
+ "step": 883000
+ },
+ {
+ "epoch": 12.0,
+ "learning_rate": 3.6339281713517303e-06,
+ "loss": 0.5127,
+ "step": 884000
+ },
+ {
+ "epoch": 12.0,
+ "learning_rate": 3.5722980755146517e-06,
+ "loss": 0.4717,
+ "step": 885000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.511175705587433e-06,
+ "loss": 0.4767,
+ "step": 886000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.4505617299945336e-06,
+ "loss": 0.5242,
+ "step": 887000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.390456811600673e-06,
+ "loss": 0.5297,
+ "step": 888000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.3308616077036115e-06,
+ "loss": 0.4846,
+ "step": 889000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.271776770026963e-06,
+ "loss": 0.4763,
+ "step": 890000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.213202944713023e-06,
+ "loss": 0.5236,
+ "step": 891000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.155140772315773e-06,
+ "loss": 0.537,
+ "step": 892000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.0975908877938277e-06,
+ "loss": 0.4858,
+ "step": 893000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 3.040553920503503e-06,
+ "loss": 0.4746,
+ "step": 894000
+ },
+ {
+ "epoch": 12.01,
+ "learning_rate": 2.9840304941919415e-06,
+ "loss": 0.523,
+ "step": 895000
+ },
+ {
+ "epoch": 12.02,
+ "learning_rate": 2.928021226990263e-06,
+ "loss": 0.5302,
+ "step": 896000
+ },
+ {
+ "epoch": 12.02,
+ "learning_rate": 2.8725267314068495e-06,
+ "loss": 0.4774,
+ "step": 897000
+ },
+ {
+ "epoch": 12.02,
+ "learning_rate": 2.817547614320615e-06,
+ "loss": 0.4829,
+ "step": 898000
+ },
+ {
+ "epoch": 12.02,
+ "learning_rate": 2.7630844769743757e-06,
+ "loss": 0.506,
+ "step": 899000
+ },
+ {
+ "epoch": 12.02,
+ "learning_rate": 2.7091379149682685e-06,
+ "loss": 0.4766,
+ "step": 900000
+ },
+ {
+ "epoch": 12.02,
+ "eval_loss": 0.4155268967151642,
+ "eval_runtime": 11.4713,
+ "eval_samples_per_second": 435.87,
+ "eval_steps_per_second": 3.487,
+ "step": 900000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
+ "total_flos": 1.5160955606283583e+19,
  "trial_name": null,
  "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c06640eca11b1304ee4e8f12cf7b6eaef37faaf4e6e12f436d38316a0500c5fe
 size 442675755

 version https://git-lfs.github.com/spec/v1
+oid sha256:094ffaaef6861196b82664bedfc2e8503866ca513e71d6cb3ec80b0579b21580
 size 442675755

runs/Apr11_08-45-40_t1v-n-fb892c44-w-0/events.out.tfevents.1681202915.t1v-n-fb892c44-w-0.3296147.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4994b45b170ab1f359b7e107842f42459f2607cb47cb4dc1faa2792f0581f1e3
-size 119713

 version https://git-lfs.github.com/spec/v1
+oid sha256:7beb2be86fc830bafff189c1a9c28e039245ef535f924cd8c862e116fb2ab071
+size 127989