Training in progress, epoch 1

Files changed (5) hide show

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "epoch": 3.0,
  "total_flos": 7.4567966957568e+16,
- "train_loss": 0.6177176833152771,
- "train_runtime": 522.0779,
- "train_samples_per_second": 5.746,
- "train_steps_per_second": 0.046
 }

 {
  "epoch": 3.0,
  "total_flos": 7.4567966957568e+16,
+ "train_loss": 0.5926340123017629,
+ "train_runtime": 76.7748,
+ "train_samples_per_second": 39.075,
+ "train_steps_per_second": 0.313
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:61f7de305ec77bce66e472e3ee95dc0c8ee5195c0f5732c297a2e6a777d90601
 size 110394865

 version https://git-lfs.github.com/spec/v1
+oid sha256:db8deb248d3eebbc81fd58dec941edb204e79e84985e479801439fbd753a0752
 size 110394865

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
  "epoch": 3.0,
  "total_flos": 7.4567966957568e+16,
- "train_loss": 0.6177176833152771,
- "train_runtime": 522.0779,
- "train_samples_per_second": 5.746,
- "train_steps_per_second": 0.046
 }

 {
  "epoch": 3.0,
  "total_flos": 7.4567966957568e+16,
+ "train_loss": 0.5926340123017629,
+ "train_runtime": 76.7748,
+ "train_samples_per_second": 39.075,
+ "train_steps_per_second": 0.313
 }

trainer_state.json CHANGED Viewed

@@ -11,50 +11,50 @@
  {
  "epoch": 1.0,
  "eval_accuracy": 0.7333333333333333,
- "eval_loss": 0.5907727479934692,
- "eval_runtime": 107.4407,
- "eval_samples_per_second": 2.234,
- "eval_steps_per_second": 0.074,
  "step": 8
  },
  {
  "epoch": 1.25,
  "learning_rate": 3.3333333333333335e-05,
- "loss": 0.652,
  "step": 10
  },
  {
  "epoch": 2.0,
  "eval_accuracy": 0.7333333333333333,
- "eval_loss": 0.5776483416557312,
- "eval_runtime": 3.2241,
- "eval_samples_per_second": 74.438,
- "eval_steps_per_second": 2.481,
  "step": 16
  },
  {
  "epoch": 2.5,
  "learning_rate": 9.523809523809523e-06,
- "loss": 0.599,
  "step": 20
  },
  {
  "epoch": 3.0,
- "eval_accuracy": 0.7333333333333333,
- "eval_loss": 0.5714371800422668,
- "eval_runtime": 3.2071,
- "eval_samples_per_second": 74.833,
- "eval_steps_per_second": 2.494,
  "step": 24
  },
  {
  "epoch": 3.0,
  "step": 24,
  "total_flos": 7.4567966957568e+16,
- "train_loss": 0.6177176833152771,
- "train_runtime": 522.0779,
- "train_samples_per_second": 5.746,
- "train_steps_per_second": 0.046
  }
  ],
  "logging_steps": 10,

  {
  "epoch": 1.0,
  "eval_accuracy": 0.7333333333333333,
+ "eval_loss": 0.6174909472465515,
+ "eval_runtime": 1.9368,
+ "eval_samples_per_second": 123.919,
+ "eval_steps_per_second": 4.131,
  "step": 8
  },
  {
  "epoch": 1.25,
  "learning_rate": 3.3333333333333335e-05,
+ "loss": 0.6122,
  "step": 10
  },
  {
  "epoch": 2.0,
  "eval_accuracy": 0.7333333333333333,
+ "eval_loss": 0.578750729560852,
+ "eval_runtime": 1.969,
+ "eval_samples_per_second": 121.891,
+ "eval_steps_per_second": 4.063,
  "step": 16
  },
  {
  "epoch": 2.5,
  "learning_rate": 9.523809523809523e-06,
+ "loss": 0.5704,
  "step": 20
  },
  {
  "epoch": 3.0,
+ "eval_accuracy": 0.7291666666666666,
+ "eval_loss": 0.5844461917877197,
+ "eval_runtime": 1.7247,
+ "eval_samples_per_second": 139.155,
+ "eval_steps_per_second": 4.639,
  "step": 24
  },
  {
  "epoch": 3.0,
  "step": 24,
  "total_flos": 7.4567966957568e+16,
+ "train_loss": 0.5926340123017629,
+ "train_runtime": 76.7748,
+ "train_samples_per_second": 39.075,
+ "train_steps_per_second": 0.313
  }
  ],
  "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2c4063f41da571724981c7a353394ad6a1288c0d5f0eba117bf3e29c875c7c0
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:17c84ea59c2c834a63bf732c8f4ef9ae4ec3c6983fa813f621b98c510d0b86fe
 size 4091