End of training

Browse files

Files changed (6) hide show

all_results.json +16 -0
eval_results.json +11 -0
runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632057532.patrick-general-gpu.502385.0 +2 -2
runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632058180.patrick-general-gpu.502385.2 +3 -0
train_results.json +8 -0
trainer_state.json +76 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+ "epoch": 3.0,
+ "eval_combined_score": 0.8911934607933856,
+ "eval_loss": 0.48608845472335815,
+ "eval_pearson": 0.8925961944446151,
+ "eval_runtime": 15.3906,
+ "eval_samples": 1500,
+ "eval_samples_per_second": 97.462,
+ "eval_spearmanr": 0.8897907271421561,
+ "eval_steps_per_second": 12.215,
+ "train_loss": 0.5799058207759151,
+ "train_runtime": 624.1289,
+ "train_samples": 5749,
+ "train_samples_per_second": 27.634,
+ "train_steps_per_second": 1.73
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+ "epoch": 3.0,
+ "eval_combined_score": 0.8911934607933856,
+ "eval_loss": 0.48608845472335815,
+ "eval_pearson": 0.8925961944446151,
+ "eval_runtime": 15.3906,
+ "eval_samples": 1500,
+ "eval_samples_per_second": 97.462,
+ "eval_spearmanr": 0.8897907271421561,
+ "eval_steps_per_second": 12.215
+}

runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632057532.patrick-general-gpu.502385.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1f8fa42dbca16738cc0bacc6e4126c5b4f724d3f61a549777a2eec76ae11ec3
-size 4958

 version https://git-lfs.github.com/spec/v1
+oid sha256:c2aad9b117f2b5848ee75cd7edb5a2e76259f704bd52c837b78b9392b4d0d0ce
+size 5312

runs/Sep19_13-18-31_patrick-general-gpu/events.out.tfevents.1632058180.patrick-general-gpu.502385.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:29b0e18d7a46bf1019237cc31b3372617bffdea4fe949b8819aa8f73ebc32ea1
+size 473

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+ "epoch": 3.0,
+ "train_loss": 0.5799058207759151,
+ "train_runtime": 624.1289,
+ "train_samples": 5749,
+ "train_samples_per_second": 27.634,
+ "train_steps_per_second": 1.73
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,76 @@

+{
+ "best_metric": null,
+ "best_model_checkpoint": null,
+ "epoch": 3.0,
+ "global_step": 1080,
+ "is_hyper_param_search": false,
+ "is_local_process_zero": true,
+ "is_world_process_zero": true,
+ "log_history": [
+ {
+ "epoch": 1.0,
+ "learning_rate": 1.3333333333333333e-05,
+ "loss": 1.1174,
+ "step": 360
+ },
+ {
+ "epoch": 1.0,
+ "eval_combined_score": 0.8815940360468737,
+ "eval_loss": 0.5000496506690979,
+ "eval_pearson": 0.8832304460348288,
+ "eval_runtime": 15.5329,
+ "eval_samples_per_second": 96.569,
+ "eval_spearmanr": 0.8799576260589187,
+ "eval_steps_per_second": 12.103,
+ "step": 360
+ },
+ {
+ "epoch": 2.0,
+ "learning_rate": 6.666666666666667e-06,
+ "loss": 0.3835,
+ "step": 720
+ },
+ {
+ "epoch": 2.0,
+ "eval_combined_score": 0.8901405153644659,
+ "eval_loss": 0.4672209620475769,
+ "eval_pearson": 0.8914800693934992,
+ "eval_runtime": 15.3324,
+ "eval_samples_per_second": 97.832,
+ "eval_spearmanr": 0.8888009613354327,
+ "eval_steps_per_second": 12.262,
+ "step": 720
+ },
+ {
+ "epoch": 3.0,
+ "learning_rate": 0.0,
+ "loss": 0.2388,
+ "step": 1080
+ },
+ {
+ "epoch": 3.0,
+ "eval_combined_score": 0.8911934607933856,
+ "eval_loss": 0.48608845472335815,
+ "eval_pearson": 0.8925961944446151,
+ "eval_runtime": 15.3291,
+ "eval_samples_per_second": 97.853,
+ "eval_spearmanr": 0.8897907271421561,
+ "eval_steps_per_second": 12.264,
+ "step": 1080
+ },
+ {
+ "epoch": 3.0,
+ "step": 1080,
+ "total_flos": 4537835628033024.0,
+ "train_loss": 0.5799058207759151,
+ "train_runtime": 624.1289,
+ "train_samples_per_second": 27.634,
+ "train_steps_per_second": 1.73
+ }
+ ],
+ "max_steps": 1080,
+ "num_train_epochs": 3,
+ "total_flos": 4537835628033024.0,
+ "trial_name": null,
+ "trial_params": null
+}