End of training

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 4.919972896575928,
-    "eval_runtime": 0.7846,
     "eval_samples": 50,
-    "eval_samples_per_second": 63.724,
-    "eval_steps_per_second": 1.274,
-    "train_loss": 5.883035182952881,
-    "train_runtime": 70.8565,
     "train_samples": 150,
-    "train_samples_per_second": 2.117,
-    "train_steps_per_second": 0.056
 }

 {
+    "epoch": 2.0,
+    "eval_loss": 3.560474157333374,
+    "eval_runtime": 0.7801,
     "eval_samples": 50,
+    "eval_samples_per_second": 64.095,
+    "eval_steps_per_second": 1.282,
+    "train_loss": 5.096200942993164,
+    "train_runtime": 318.685,
     "train_samples": 150,
+    "train_samples_per_second": 0.941,
+    "train_steps_per_second": 0.025
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "eval_loss": 4.919972896575928,
-    "eval_runtime": 0.7846,
     "eval_samples": 50,
-    "eval_samples_per_second": 63.724,
-    "eval_steps_per_second": 1.274
 }

 {
+    "epoch": 2.0,
+    "eval_loss": 3.560474157333374,
+    "eval_runtime": 0.7801,
     "eval_samples": 50,
+    "eval_samples_per_second": 64.095,
+    "eval_steps_per_second": 1.282
 }

runs/Nov13_14-18-47_dell-NF5468M6/events.out.tfevents.1668321241.dell-NF5468M6.6637.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bcec4812307c433de971a8d91307cc0346d34b6e428282cc9f87e7fb05a9f864
+size 306

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 1.0,
-    "train_loss": 5.883035182952881,
-    "train_runtime": 70.8565,
     "train_samples": 150,
-    "train_samples_per_second": 2.117,
-    "train_steps_per_second": 0.056
 }

 {
+    "epoch": 2.0,
+    "train_loss": 5.096200942993164,
+    "train_runtime": 318.685,
     "train_samples": 150,
+    "train_samples_per_second": 0.941,
+    "train_steps_per_second": 0.025
 }

trainer_state.json CHANGED Viewed

@@ -1,33 +1,41 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.0,
-  "global_step": 4,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 4.919972896575928,
-      "eval_runtime": 0.8786,
-      "eval_samples_per_second": 56.911,
-      "eval_steps_per_second": 1.138,
       "step": 4
     },
     {
-      "epoch": 1.0,
-      "step": 4,
-      "total_flos": 8347272192000.0,
-      "train_loss": 5.883035182952881,
-      "train_runtime": 70.8565,
-      "train_samples_per_second": 2.117,
-      "train_steps_per_second": 0.056
     }
   ],
-  "max_steps": 4,
-  "num_train_epochs": 1,
-  "total_flos": 8347272192000.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.0,
+  "global_step": 8,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 4.192291259765625,
+      "eval_runtime": 0.896,
+      "eval_samples_per_second": 55.802,
+      "eval_steps_per_second": 1.116,
       "step": 4
     },
     {
+      "epoch": 2.0,
+      "eval_loss": 3.560474157333374,
+      "eval_runtime": 0.8672,
+      "eval_samples_per_second": 57.66,
+      "eval_steps_per_second": 1.153,
+      "step": 8
+    },
+    {
+      "epoch": 2.0,
+      "step": 8,
+      "total_flos": 16719916032000.0,
+      "train_loss": 5.096200942993164,
+      "train_runtime": 318.685,
+      "train_samples_per_second": 0.941,
+      "train_steps_per_second": 0.025
     }
   ],
+  "max_steps": 8,
+  "num_train_epochs": 2,
+  "total_flos": 16719916032000.0,
   "trial_name": null,
   "trial_params": null
 }