Upload 15 files

Browse files

Files changed (10) hide show

config.json +2 -2
generation_config.json +13 -0
optimizer.pt +3 -0
pytorch_model.bin +1 -1
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
tokenizer_config.json +2 -2
trainer_state.json +226 -0
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/lustre/projects/cardiff/bart/bart-base",
   "activation_dropout": 0.1,
   "activation_function": "gelu",
   "add_bias_logits": false,
@@ -69,7 +69,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.26.0.dev0",
   "use_cache": true,
   "vocab_size": 50269
 }

 {
+  "_name_or_path": "facebook/bart-base",
   "activation_dropout": 0.1,
   "activation_function": "gelu",
   "add_bias_logits": false,
     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.26.1",
   "use_cache": true,
   "vocab_size": 50269
 }

generation_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "_from_model_config": true,
+  "bos_token_id": 0,
+  "decoder_start_token_id": 2,
+  "early_stopping": true,
+  "eos_token_id": 2,
+  "forced_bos_token_id": 0,
+  "forced_eos_token_id": 2,
+  "no_repeat_ngram_size": 3,
+  "num_beams": 4,
+  "pad_token_id": 1,
+  "transformers_version": "4.26.1"
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:831134c2202a73897debd659329db91c6bcdce2a187b9af3d0382bef9355d82c
+size 1115539909

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68b04438e11c883d15e15c41e3e911503c102541d6137ccce6333da627cdc3d1
 size 557983517

 version https://git-lfs.github.com/spec/v1
+oid sha256:3437249cda3a802a24c3440dbf572b9af6927e09e118f652efca8edd2dcf9a77
 size 557983517

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:098e1d40526cacd3740caab46d2b7ba1af48c6d4b2f48a79e80bed7577755a7d
+size 14575

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4aa1a21c5a9c0d61520eb2233b2e5d0b3a2d290e2966820d403c972921e8aa71
+size 557

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:38d6d1bcdccb678167f0a57d9e8c5214e64f91d31d24c2a46723c1904e4bb722
+size 627

tokenizer_config.json CHANGED Viewed

@@ -5,8 +5,8 @@
   "eos_token": "</s>",
   "errors": "replace",
   "mask_token": "<mask>",
-  "model_max_length": 1000000000000000019884624838656,
-  "name_or_path": "/lustre/projects/cardiff/bart/bart-base",
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "special_tokens_map_file": null,

   "eos_token": "</s>",
   "errors": "replace",
   "mask_token": "<mask>",
+  "model_max_length": 1024,
+  "name_or_path": "facebook/bart-base",
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "special_tokens_map_file": null,

trainer_state.json ADDED Viewed

	@@ -0,0 +1,226 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 15.4608,
+  "global_step": 1500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 4.800000000000001e-06,
+      "loss": 10.7159,
+      "step": 97
+    },
+    {
+      "epoch": 0.99,
+      "eval_loss": 7.062511920928955,
+      "eval_runtime": 16.5468,
+      "eval_samples_per_second": 604.347,
+      "eval_steps_per_second": 37.772,
+      "step": 97
+    },
+    {
+      "epoch": 1.99,
+      "learning_rate": 9.65e-06,
+      "loss": 5.0371,
+      "step": 194
+    },
+    {
+      "epoch": 1.99,
+      "eval_loss": 2.8384995460510254,
+      "eval_runtime": 16.0338,
+      "eval_samples_per_second": 623.684,
+      "eval_steps_per_second": 38.98,
+      "step": 194
+    },
+    {
+      "epoch": 2.99,
+      "learning_rate": 1.4449999999999999e-05,
+      "loss": 2.4865,
+      "step": 291
+    },
+    {
+      "epoch": 2.99,
+      "eval_loss": 1.1602892875671387,
+      "eval_runtime": 16.2241,
+      "eval_samples_per_second": 616.367,
+      "eval_steps_per_second": 38.523,
+      "step": 291
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 1.93e-05,
+      "loss": 1.0806,
+      "step": 388
+    },
+    {
+      "epoch": 3.99,
+      "eval_loss": 0.7614782452583313,
+      "eval_runtime": 16.2665,
+      "eval_samples_per_second": 614.761,
+      "eval_steps_per_second": 38.423,
+      "step": 388
+    },
+    {
+      "epoch": 4.99,
+      "learning_rate": 2.415e-05,
+      "loss": 0.8412,
+      "step": 485
+    },
+    {
+      "epoch": 4.99,
+      "eval_loss": 0.726601243019104,
+      "eval_runtime": 16.7852,
+      "eval_samples_per_second": 595.764,
+      "eval_steps_per_second": 37.235,
+      "step": 485
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 2.9e-05,
+      "loss": 0.802,
+      "step": 582
+    },
+    {
+      "epoch": 5.99,
+      "eval_loss": 0.7105833292007446,
+      "eval_runtime": 16.763,
+      "eval_samples_per_second": 596.553,
+      "eval_steps_per_second": 37.285,
+      "step": 582
+    },
+    {
+      "epoch": 6.99,
+      "learning_rate": 3.385e-05,
+      "loss": 0.7776,
+      "step": 679
+    },
+    {
+      "epoch": 6.99,
+      "eval_loss": 0.6986653804779053,
+      "eval_runtime": 16.7875,
+      "eval_samples_per_second": 595.68,
+      "eval_steps_per_second": 37.23,
+      "step": 679
+    },
+    {
+      "epoch": 7.99,
+      "learning_rate": 3.8700000000000006e-05,
+      "loss": 0.7568,
+      "step": 776
+    },
+    {
+      "epoch": 7.99,
+      "eval_loss": 0.687833309173584,
+      "eval_runtime": 16.4861,
+      "eval_samples_per_second": 606.571,
+      "eval_steps_per_second": 37.911,
+      "step": 776
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 4.355e-05,
+      "loss": 0.7382,
+      "step": 873
+    },
+    {
+      "epoch": 8.99,
+      "eval_loss": 0.6793721914291382,
+      "eval_runtime": 16.6577,
+      "eval_samples_per_second": 600.323,
+      "eval_steps_per_second": 37.52,
+      "step": 873
+    },
+    {
+      "epoch": 9.99,
+      "learning_rate": 4.8400000000000004e-05,
+      "loss": 0.7202,
+      "step": 970
+    },
+    {
+      "epoch": 9.99,
+      "eval_loss": 0.6695303320884705,
+      "eval_runtime": 16.3181,
+      "eval_samples_per_second": 612.817,
+      "eval_steps_per_second": 38.301,
+      "step": 970
+    },
+    {
+      "epoch": 10.99,
+      "learning_rate": 4.6542553191489364e-05,
+      "loss": 0.7022,
+      "step": 1067
+    },
+    {
+      "epoch": 10.99,
+      "eval_loss": 0.6605609059333801,
+      "eval_runtime": 16.748,
+      "eval_samples_per_second": 597.086,
+      "eval_steps_per_second": 37.318,
+      "step": 1067
+    },
+    {
+      "epoch": 11.99,
+      "learning_rate": 4.138297872340426e-05,
+      "loss": 0.6844,
+      "step": 1164
+    },
+    {
+      "epoch": 11.99,
+      "eval_loss": 0.6539720892906189,
+      "eval_runtime": 16.7037,
+      "eval_samples_per_second": 598.671,
+      "eval_steps_per_second": 37.417,
+      "step": 1164
+    },
+    {
+      "epoch": 12.99,
+      "learning_rate": 3.622340425531915e-05,
+      "loss": 0.669,
+      "step": 1261
+    },
+    {
+      "epoch": 12.99,
+      "eval_loss": 0.6471053957939148,
+      "eval_runtime": 16.5172,
+      "eval_samples_per_second": 605.43,
+      "eval_steps_per_second": 37.839,
+      "step": 1261
+    },
+    {
+      "epoch": 13.99,
+      "learning_rate": 3.1063829787234046e-05,
+      "loss": 0.6562,
+      "step": 1358
+    },
+    {
+      "epoch": 13.99,
+      "eval_loss": 0.6417160034179688,
+      "eval_runtime": 16.0822,
+      "eval_samples_per_second": 621.804,
+      "eval_steps_per_second": 38.863,
+      "step": 1358
+    },
+    {
+      "epoch": 14.99,
+      "learning_rate": 2.590425531914894e-05,
+      "loss": 0.6453,
+      "step": 1455
+    },
+    {
+      "epoch": 14.99,
+      "eval_loss": 0.6380994915962219,
+      "eval_runtime": 16.4132,
+      "eval_samples_per_second": 609.265,
+      "eval_steps_per_second": 38.079,
+      "step": 1455
+    }
+  ],
+  "max_steps": 1940,
+  "num_train_epochs": 20,
+  "total_flos": 5.89188339597312e+16,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:207f7859517470b9d297e0ed63cd5354a4f56b93e0d4b4ac80e96a3e0f517bc4
 size 3643

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d1a8fc4f5a85f1317b5de75f286f84c7011e5753082c8d97b2bc1ecea1cf191
 size 3643