joelniklaus commited on Mar 30, 2023

Commit

e8120ef

•

1 Parent(s): be74cf2

Training in progress, step 700000

Browse files

Files changed (17) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/rng_state_4.pth +1 -1
last-checkpoint/rng_state_5.pth +1 -1
last-checkpoint/rng_state_6.pth +1 -1
last-checkpoint/rng_state_7.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +311 -3
last-checkpoint/training_args.bin +1 -1
pytorch_model.bin +1 -1
runs/Mar22_03-02-10_t1v-n-ae339136-w-0/1679454966.5971136/events.out.tfevents.1679454966.t1v-n-ae339136-w-0.10622.1 +3 -0
runs/Mar22_03-02-10_t1v-n-ae339136-w-0/events.out.tfevents.1679454966.t1v-n-ae339136-w-0.10622.0 +3 -0
training_args.bin +1 -1

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80276c82f803233f5fdb661f073deaa493a9da9622e517afb26a84ad5e426889
 size 3480942553

 version https://git-lfs.github.com/spec/v1
+oid sha256:dbe29aa02358e2143d72f205b3a4a91a5018b93605acb79f66ed604b5f19383d
 size 3480942553

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:010ff15e7c5b4944d147f08e3ca39a7a13d144f0ac2b46d7be37da6a2832f71d
 size 1740493675

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb5b90c98009d51696b36759831d22a584a9950a286ec1f19cf3456f91a65bb8
 size 1740493675

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_4.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_5.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_6.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/rng_state_7.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9938c710ed3be6b7a7709c622a2ddd00b0b3538d188f7c24757e3a01a9d961a9
 size 13611

 version https://git-lfs.github.com/spec/v1
+oid sha256:a144c4622f8cf43db68e969e7f66a4be23d7f871fcf2af4c5f77f6f71f88ad58
 size 13611

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d7fa20411577666fac76fe76348b4f9231439cc2e524d6e3185910c258591e9
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:d2d6ab5c2c0046e2c66cf435ff00463ff3da7208ddb35b5b6f19c87d94f3623b
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "best_metric": null,
  "best_model_checkpoint": null,
- "epoch": 0.65,
- "global_step": 650000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
@@ -4010,11 +4010,319 @@
  "eval_samples_per_second": 29.262,
  "eval_steps_per_second": 0.462,
  "step": 650000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
- "total_flos": 3.87847022444544e+19,
  "trial_name": null,
  "trial_params": null
 }

 {
  "best_metric": null,
  "best_model_checkpoint": null,
+ "epoch": 0.7,
+ "global_step": 700000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "eval_samples_per_second": 29.262,
  "eval_steps_per_second": 0.462,
  "step": 650000
+ },
+ {
+ "epoch": 0.65,
+ "learning_rate": 2.976391850971065e-05,
+ "loss": 0.8019,
+ "step": 651000
+ },
+ {
+ "epoch": 0.65,
+ "learning_rate": 2.9612829550614836e-05,
+ "loss": 0.8151,
+ "step": 652000
+ },
+ {
+ "epoch": 0.65,
+ "learning_rate": 2.9461963542348737e-05,
+ "loss": 0.8159,
+ "step": 653000
+ },
+ {
+ "epoch": 0.65,
+ "learning_rate": 2.931132213475884e-05,
+ "loss": 0.8109,
+ "step": 654000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.916090697523549e-05,
+ "loss": 0.8056,
+ "step": 655000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.9010719708694722e-05,
+ "loss": 0.7921,
+ "step": 656000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.8860761977560436e-05,
+ "loss": 0.7977,
+ "step": 657000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.8711035421746367e-05,
+ "loss": 0.8184,
+ "step": 658000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.8561541678638142e-05,
+ "loss": 0.7923,
+ "step": 659000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.8412282383075363e-05,
+ "loss": 0.8042,
+ "step": 660000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.8263259167333777e-05,
+ "loss": 0.7837,
+ "step": 661000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.811447366110741e-05,
+ "loss": 0.7822,
+ "step": 662000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.7965927491490705e-05,
+ "loss": 0.7886,
+ "step": 663000
+ },
+ {
+ "epoch": 0.66,
+ "learning_rate": 2.7817622282960815e-05,
+ "loss": 0.8035,
+ "step": 664000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.766955965735968e-05,
+ "loss": 0.8047,
+ "step": 665000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.7521741233876496e-05,
+ "loss": 0.7887,
+ "step": 666000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.7374168629029813e-05,
+ "loss": 0.786,
+ "step": 667000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.7226843456650037e-05,
+ "loss": 0.796,
+ "step": 668000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.707976732786166e-05,
+ "loss": 0.7884,
+ "step": 669000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.693294185106562e-05,
+ "loss": 0.8067,
+ "step": 670000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.6786368631921836e-05,
+ "loss": 0.7903,
+ "step": 671000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.6640049273331515e-05,
+ "loss": 0.8027,
+ "step": 672000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.6493985375419778e-05,
+ "loss": 0.796,
+ "step": 673000
+ },
+ {
+ "epoch": 0.67,
+ "learning_rate": 2.6348178535517966e-05,
+ "loss": 0.8048,
+ "step": 674000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.6202630348146324e-05,
+ "loss": 0.7818,
+ "step": 675000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.6057342404996522e-05,
+ "loss": 0.7887,
+ "step": 676000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.591231629491423e-05,
+ "loss": 0.8113,
+ "step": 677000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.5767553603881767e-05,
+ "loss": 0.8007,
+ "step": 678000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.562305591500069e-05,
+ "loss": 0.7915,
+ "step": 679000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.547882480847461e-05,
+ "loss": 0.8059,
+ "step": 680000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.5334861861591753e-05,
+ "loss": 0.8149,
+ "step": 681000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.5191168648707887e-05,
+ "loss": 0.8027,
+ "step": 682000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.5047746741228978e-05,
+ "loss": 0.8,
+ "step": 683000
+ },
+ {
+ "epoch": 0.68,
+ "learning_rate": 2.490459770759398e-05,
+ "loss": 0.784,
+ "step": 684000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.476172311325783e-05,
+ "loss": 0.7895,
+ "step": 685000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.4619124520674146e-05,
+ "loss": 0.7837,
+ "step": 686000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.447680348927837e-05,
+ "loss": 0.7905,
+ "step": 687000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.433476157547044e-05,
+ "loss": 0.7852,
+ "step": 688000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.419300033259798e-05,
+ "loss": 0.7815,
+ "step": 689000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.405152131093926e-05,
+ "loss": 0.7644,
+ "step": 690000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.3910326057686127e-05,
+ "loss": 0.7401,
+ "step": 691000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.3769416116927335e-05,
+ "loss": 0.744,
+ "step": 692000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.362879302963135e-05,
+ "loss": 0.7276,
+ "step": 693000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.3488458333629777e-05,
+ "loss": 0.7099,
+ "step": 694000
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 2.3348413563600325e-05,
+ "loss": 0.7142,
+ "step": 695000
+ },
+ {
+ "epoch": 0.7,
+ "learning_rate": 2.3208660251050158e-05,
+ "loss": 0.7357,
+ "step": 696000
+ },
+ {
+ "epoch": 0.7,
+ "learning_rate": 2.3069199924299174e-05,
+ "loss": 0.7397,
+ "step": 697000
+ },
+ {
+ "epoch": 0.7,
+ "learning_rate": 2.29300341084631e-05,
+ "loss": 0.7371,
+ "step": 698000
+ },
+ {
+ "epoch": 0.7,
+ "learning_rate": 2.279116432543705e-05,
+ "loss": 0.7174,
+ "step": 699000
+ },
+ {
+ "epoch": 0.7,
+ "learning_rate": 2.2652592093878666e-05,
+ "loss": 0.7433,
+ "step": 700000
+ },
+ {
+ "epoch": 0.7,
+ "eval_loss": 0.3951902687549591,
+ "eval_runtime": 184.5949,
+ "eval_samples_per_second": 27.086,
+ "eval_steps_per_second": 0.428,
+ "step": 700000
  }
  ],
  "max_steps": 1000000,
  "num_train_epochs": 9223372036854775807,
+ "total_flos": 4.17681408786432e+19,
  "trial_name": null,
  "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db82a1b292273e59a4cde694eb5b29617673aa0dcee2fd4598267bfb6eaa669f
 size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2b92bb609d314cf22d9efbf8583c1eb78e2d6778c97eddc20b95b0c856addb3
 size 3439

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:010ff15e7c5b4944d147f08e3ca39a7a13d144f0ac2b46d7be37da6a2832f71d
 size 1740493675

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb5b90c98009d51696b36759831d22a584a9950a286ec1f19cf3456f91a65bb8
 size 1740493675

runs/Mar22_03-02-10_t1v-n-ae339136-w-0/1679454966.5971136/events.out.tfevents.1679454966.t1v-n-ae339136-w-0.10622.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9332a482b85987bb1c463d7cfbb9a61379e7115b6d0ee845488113f42c11ff6d
+size 5479

runs/Mar22_03-02-10_t1v-n-ae339136-w-0/events.out.tfevents.1679454966.t1v-n-ae339136-w-0.10622.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7aace6ac9dd370a01161ccd7df8ab06deeb0d1f70aae54fc815d42c71c0f138
+size 12089

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:db82a1b292273e59a4cde694eb5b29617673aa0dcee2fd4598267bfb6eaa669f
 size 3439

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2b92bb609d314cf22d9efbf8583c1eb78e2d6778c97eddc20b95b0c856addb3
 size 3439