Model save

Files changed (8) hide show

adapter_config.json CHANGED Viewed

@@ -19,13 +19,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "o_proj",
     "up_proj",
-    "down_proj",
     "k_proj",
     "v_proj",
     "gate_proj",
-    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "up_proj",
+    "q_proj",
     "k_proj",
     "v_proj",
     "gate_proj",
+    "down_proj",
+    "o_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

all_results.json CHANGED Viewed

@@ -9,13 +9,13 @@
     "eval_rewards/chosen": 0.5534913539886475,
     "eval_rewards/margins": 0.214975506067276,
     "eval_rewards/rejected": 0.33851587772369385,
-    "eval_runtime": 181.731,
     "eval_samples": 398,
-    "eval_samples_per_second": 2.19,
-    "eval_steps_per_second": 2.19,
     "train_loss": 0.06080360662445443,
-    "train_runtime": 395.7009,
     "train_samples": 3588,
-    "train_samples_per_second": 9.067,
-    "train_steps_per_second": 2.267
 }

     "eval_rewards/chosen": 0.5534913539886475,
     "eval_rewards/margins": 0.214975506067276,
     "eval_rewards/rejected": 0.33851587772369385,
+    "eval_runtime": 182.0633,
     "eval_samples": 398,
+    "eval_samples_per_second": 2.186,
+    "eval_steps_per_second": 2.186,
     "train_loss": 0.06080360662445443,
+    "train_runtime": 396.0244,
     "train_samples": 3588,
+    "train_samples_per_second": 9.06,
+    "train_steps_per_second": 2.265
 }

eval_results.json CHANGED Viewed

@@ -9,8 +9,8 @@
     "eval_rewards/chosen": 0.5534913539886475,
     "eval_rewards/margins": 0.214975506067276,
     "eval_rewards/rejected": 0.33851587772369385,
-    "eval_runtime": 181.731,
     "eval_samples": 398,
-    "eval_samples_per_second": 2.19,
-    "eval_steps_per_second": 2.19
 }

     "eval_rewards/chosen": 0.5534913539886475,
     "eval_rewards/margins": 0.214975506067276,
     "eval_rewards/rejected": 0.33851587772369385,
+    "eval_runtime": 182.0633,
     "eval_samples": 398,
+    "eval_samples_per_second": 2.186,
+    "eval_steps_per_second": 2.186
 }

runs/Mar11_07-16-34_b89f062cf3e1/events.out.tfevents.1710141453.b89f062cf3e1.24911.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f65749c701d749b19f74028d18f861599db841d2cf63df4f00bf4e3e127bbd9c
+size 11021

runs/Mar11_07-16-34_b89f062cf3e1/events.out.tfevents.1710142031.b89f062cf3e1.24911.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4312817dd381f1ce94651c8da6e3424b36b99cc5961f48015fd28c2d779a4e65
+size 828

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "train_loss": 0.06080360662445443,
-    "train_runtime": 395.7009,
     "train_samples": 3588,
-    "train_samples_per_second": 9.067,
-    "train_steps_per_second": 2.267
 }

 {
     "epoch": 1.0,
     "train_loss": 0.06080360662445443,
+    "train_runtime": 396.0244,
     "train_samples": 3588,
+    "train_samples_per_second": 9.06,
+    "train_steps_per_second": 2.265
 }

trainer_state.json CHANGED Viewed

@@ -1401,9 +1401,9 @@
       "step": 897,
       "total_flos": 0.0,
       "train_loss": 0.06080360662445443,
-      "train_runtime": 395.7009,
-      "train_samples_per_second": 9.067,
-      "train_steps_per_second": 2.267
     }
   ],
   "logging_steps": 10,

       "step": 897,
       "total_flos": 0.0,
       "train_loss": 0.06080360662445443,
+      "train_runtime": 396.0244,
+      "train_samples_per_second": 9.06,
+      "train_steps_per_second": 2.265
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb9bb8efdb9c6841452004c47a87a4862f6eeb584a1259066be691727e36b983
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:08158f8de09de548b5fa100048a5c91d786e4bd87dbf7215b24a3082f6775961
 size 4856