Model save

Files changed (9) hide show

adapter_config.json CHANGED Viewed

@@ -17,9 +17,9 @@
   "revision": null,
   "target_modules": [
     "q_proj",
     "v_proj",
-    "o_proj",
-    "k_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

   "revision": null,
   "target_modules": [
     "q_proj",
+    "k_proj",
     "v_proj",
+    "o_proj"
   ],
   "task_type": "CAUSAL_LM"
 }

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ab86371f50ae43ed266252d6db4b66c379eff8391b9543f7ed4782761a7432c
 size 218138576

 version https://git-lfs.github.com/spec/v1
+oid sha256:86153f980d9b196097ccc204da082dd9c6aeafc01ef1aa0bfcc4790e74b9d4a9
 size 218138576

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9899529814720154,
-    "eval_runtime": 2915.5922,
     "eval_samples": 23110,
-    "eval_samples_per_second": 7.926,
-    "eval_steps_per_second": 0.991,
-    "train_loss": 1.009575615034384,
-    "train_runtime": 87164.7513,
     "train_samples": 207865,
-    "train_samples_per_second": 2.385,
     "train_steps_per_second": 0.005
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.9899672269821167,
+    "eval_runtime": 2925.3835,
     "eval_samples": 23110,
+    "eval_samples_per_second": 7.9,
+    "eval_steps_per_second": 0.988,
+    "train_loss": 1.0095806910711176,
+    "train_runtime": 87675.0459,
     "train_samples": 207865,
+    "train_samples_per_second": 2.371,
     "train_steps_per_second": 0.005
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9899529814720154,
-    "eval_runtime": 2915.5922,
     "eval_samples": 23110,
-    "eval_samples_per_second": 7.926,
-    "eval_steps_per_second": 0.991
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.9899672269821167,
+    "eval_runtime": 2925.3835,
     "eval_samples": 23110,
+    "eval_samples_per_second": 7.9,
+    "eval_steps_per_second": 0.988
 }

runs/Dec30_09-43-19_node-0/events.out.tfevents.1703958425.node-0.3394.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f14be31447647ea0e181f47e25465c386aba04be06ea492f559857aed329f2ad
+size 13436

runs/Dec30_09-43-19_node-0/events.out.tfevents.1704049025.node-0.3394.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:be60f08243dab2e724f736c541449536b880bc5177e8d8a9b4b9ec3fd399372b
+size 359

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "train_loss": 1.009575615034384,
-    "train_runtime": 87164.7513,
     "train_samples": 207865,
-    "train_samples_per_second": 2.385,
     "train_steps_per_second": 0.005
 }

 {
     "epoch": 0.67,
+    "train_loss": 1.0095806910711176,
+    "train_runtime": 87675.0459,
     "train_samples": 207865,
+    "train_samples_per_second": 2.371,
     "train_steps_per_second": 0.005
 }

trainer_state.json CHANGED Viewed

@@ -149,19 +149,19 @@
     {
       "epoch": 0.28,
       "learning_rate": 1.627812124672099e-05,
-      "loss": 0.9937,
       "step": 115
     },
     {
       "epoch": 0.3,
       "learning_rate": 1.5971585917027864e-05,
-      "loss": 0.998,
       "step": 120
     },
     {
       "epoch": 0.31,
       "learning_rate": 1.5656068754865388e-05,
-      "loss": 0.9953,
       "step": 125
     },
     {
@@ -281,7 +281,7 @@
     {
       "epoch": 0.55,
       "learning_rate": 8.263518223330698e-06,
-      "loss": 0.9917,
       "step": 225
     },
     {
@@ -305,7 +305,7 @@
     {
       "epoch": 0.6,
       "learning_rate": 6.762660579416791e-06,
-      "loss": 0.9967,
       "step": 245
     },
     {
@@ -340,19 +340,19 @@
     },
     {
       "epoch": 0.67,
-      "eval_loss": 0.9899529814720154,
-      "eval_runtime": 2912.0163,
-      "eval_samples_per_second": 7.936,
-      "eval_steps_per_second": 0.992,
       "step": 272
     },
     {
       "epoch": 0.67,
       "step": 272,
       "total_flos": 1.2275875027210994e+19,
-      "train_loss": 1.009575615034384,
-      "train_runtime": 87164.7513,
-      "train_samples_per_second": 2.385,
       "train_steps_per_second": 0.005
     }
   ],

     {
       "epoch": 0.28,
       "learning_rate": 1.627812124672099e-05,
+      "loss": 0.9936,
       "step": 115
     },
     {
       "epoch": 0.3,
       "learning_rate": 1.5971585917027864e-05,
+      "loss": 0.9981,
       "step": 120
     },
     {
       "epoch": 0.31,
       "learning_rate": 1.5656068754865388e-05,
+      "loss": 0.9954,
       "step": 125
     },
     {
     {
       "epoch": 0.55,
       "learning_rate": 8.263518223330698e-06,
+      "loss": 0.9918,
       "step": 225
     },
     {
     {
       "epoch": 0.6,
       "learning_rate": 6.762660579416791e-06,
+      "loss": 0.9968,
       "step": 245
     },
     {
     },
     {
       "epoch": 0.67,
+      "eval_loss": 0.9899672269821167,
+      "eval_runtime": 2926.0545,
+      "eval_samples_per_second": 7.898,
+      "eval_steps_per_second": 0.987,
       "step": 272
     },
     {
       "epoch": 0.67,
       "step": 272,
       "total_flos": 1.2275875027210994e+19,
+      "train_loss": 1.0095806910711176,
+      "train_runtime": 87675.0459,
+      "train_samples_per_second": 2.371,
       "train_steps_per_second": 0.005
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c7cb521cdf4c1fd969ef51bd2d60bbfa27ab215cc3c126b7930b1bf1876bbb81
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:48012117f359d93f6f11e37307131da164e15c7f0c3130b3e312cd4922e74142
 size 4664