Training in progress, epoch 1

Browse files

Files changed (8) hide show

.DS_Store +0 -0
all_results.json +7 -0
config.json +36 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
train_results.json +7 -0
trainer_state.json +292 -0
training_args.bin +3 -0

.DS_Store ADDED Viewed

Binary file (10.2 kB). View file

all_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+ "epoch": 10.0,
+ "train_loss": 0.7178522997889025,
+ "train_runtime": 2833.88,
+ "train_samples_per_second": 6.514,
+ "train_steps_per_second": 0.102
+}

config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+ "_name_or_path": "google/vit-base-patch16-224-in21k",
+ "architectures": [
+ "ViTForImageClassification"
+ ],
+ "attention_probs_dropout_prob": 0.0,
+ "encoder_stride": 16,
+ "hidden_act": "gelu",
+ "hidden_dropout_prob": 0.0,
+ "hidden_size": 768,
+ "id2label": {
+ "0": "0.0",
+ "1": "1/3",
+ "2": "2/3",
+ "3": "1.0"
+ },
+ "image_size": 224,
+ "initializer_range": 0.02,
+ "intermediate_size": 3072,
+ "label2id": {
+ "0.0": "0",
+ "1.0": "3",
+ "1/3": "1",
+ "2/3": "2"
+ },
+ "layer_norm_eps": 1e-12,
+ "model_type": "vit",
+ "num_attention_heads": 12,
+ "num_channels": 3,
+ "num_hidden_layers": 12,
+ "patch_size": 16,
+ "problem_type": "single_label_classification",
+ "qkv_bias": true,
+ "torch_dtype": "float32",
+ "transformers_version": "4.35.0"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:94d22a7251fa08080292b70c8a84fe557851a94bf339e1855d36b0a9286bab4d
+size 343230128

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+ "do_normalize": true,
+ "do_rescale": true,
+ "do_resize": true,
+ "image_mean": [
+ 0.5,
+ 0.5,
+ 0.5
+ ],
+ "image_processor_type": "ViTImageProcessor",
+ "image_std": [
+ 0.5,
+ 0.5,
+ 0.5
+ ],
+ "resample": 2,
+ "rescale_factor": 0.00392156862745098,
+ "size": {
+ "height": 224,
+ "width": 224
+ }
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+ "epoch": 10.0,
+ "train_loss": 0.7178522997889025,
+ "train_runtime": 2833.88,
+ "train_samples_per_second": 6.514,
+ "train_steps_per_second": 0.102
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,292 @@

+{
+ "best_metric": 0.7518796992481203,
+ "best_model_checkpoint": "../results/elpv-vit/checkpoint-232",
+ "epoch": 10.0,
+ "eval_steps": 500,
+ "global_step": 290,
+ "is_hyper_param_search": false,
+ "is_local_process_zero": true,
+ "is_world_process_zero": true,
+ "log_history": [
+ {
+ "epoch": 0.34,
+ "learning_rate": 1.7241379310344828e-05,
+ "loss": 1.3357,
+ "step": 10
+ },
+ {
+ "epoch": 0.69,
+ "learning_rate": 3.4482758620689657e-05,
+ "loss": 1.1598,
+ "step": 20
+ },
+ {
+ "epoch": 1.0,
+ "eval_accuracy": 0.6954887218045113,
+ "eval_loss": 0.9091870188713074,
+ "eval_runtime": 10.3022,
+ "eval_samples_per_second": 25.82,
+ "eval_steps_per_second": 1.65,
+ "step": 29
+ },
+ {
+ "epoch": 1.03,
+ "learning_rate": 4.980842911877395e-05,
+ "loss": 0.9746,
+ "step": 30
+ },
+ {
+ "epoch": 1.38,
+ "learning_rate": 4.789272030651341e-05,
+ "loss": 0.8597,
+ "step": 40
+ },
+ {
+ "epoch": 1.72,
+ "learning_rate": 4.597701149425287e-05,
+ "loss": 0.8226,
+ "step": 50
+ },
+ {
+ "epoch": 2.0,
+ "eval_accuracy": 0.7368421052631579,
+ "eval_loss": 0.7852613925933838,
+ "eval_runtime": 10.1106,
+ "eval_samples_per_second": 26.309,
+ "eval_steps_per_second": 1.681,
+ "step": 58
+ },
+ {
+ "epoch": 2.07,
+ "learning_rate": 4.406130268199234e-05,
+ "loss": 0.7585,
+ "step": 60
+ },
+ {
+ "epoch": 2.41,
+ "learning_rate": 4.21455938697318e-05,
+ "loss": 0.7611,
+ "step": 70
+ },
+ {
+ "epoch": 2.76,
+ "learning_rate": 4.0229885057471265e-05,
+ "loss": 0.6841,
+ "step": 80
+ },
+ {
+ "epoch": 3.0,
+ "eval_accuracy": 0.7180451127819549,
+ "eval_loss": 0.811350405216217,
+ "eval_runtime": 13.3447,
+ "eval_samples_per_second": 19.933,
+ "eval_steps_per_second": 1.274,
+ "step": 87
+ },
+ {
+ "epoch": 3.1,
+ "learning_rate": 3.831417624521073e-05,
+ "loss": 0.7207,
+ "step": 90
+ },
+ {
+ "epoch": 3.45,
+ "learning_rate": 3.6398467432950195e-05,
+ "loss": 0.7422,
+ "step": 100
+ },
+ {
+ "epoch": 3.79,
+ "learning_rate": 3.4482758620689657e-05,
+ "loss": 0.73,
+ "step": 110
+ },
+ {
+ "epoch": 4.0,
+ "eval_accuracy": 0.7293233082706767,
+ "eval_loss": 0.7547905445098877,
+ "eval_runtime": 11.7612,
+ "eval_samples_per_second": 22.617,
+ "eval_steps_per_second": 1.445,
+ "step": 116
+ },
+ {
+ "epoch": 4.14,
+ "learning_rate": 3.256704980842912e-05,
+ "loss": 0.6787,
+ "step": 120
+ },
+ {
+ "epoch": 4.48,
+ "learning_rate": 3.065134099616858e-05,
+ "loss": 0.6738,
+ "step": 130
+ },
+ {
+ "epoch": 4.83,
+ "learning_rate": 2.8735632183908045e-05,
+ "loss": 0.6725,
+ "step": 140
+ },
+ {
+ "epoch": 5.0,
+ "eval_accuracy": 0.7406015037593985,
+ "eval_loss": 0.75775146484375,
+ "eval_runtime": 12.9654,
+ "eval_samples_per_second": 20.516,
+ "eval_steps_per_second": 1.311,
+ "step": 145
+ },
+ {
+ "epoch": 5.17,
+ "learning_rate": 2.681992337164751e-05,
+ "loss": 0.6785,
+ "step": 150
+ },
+ {
+ "epoch": 5.52,
+ "learning_rate": 2.4904214559386975e-05,
+ "loss": 0.6259,
+ "step": 160
+ },
+ {
+ "epoch": 5.86,
+ "learning_rate": 2.2988505747126437e-05,
+ "loss": 0.6625,
+ "step": 170
+ },
+ {
+ "epoch": 6.0,
+ "eval_accuracy": 0.7368421052631579,
+ "eval_loss": 0.732495129108429,
+ "eval_runtime": 14.6428,
+ "eval_samples_per_second": 18.166,
+ "eval_steps_per_second": 1.161,
+ "step": 174
+ },
+ {
+ "epoch": 6.21,
+ "learning_rate": 2.10727969348659e-05,
+ "loss": 0.6335,
+ "step": 180
+ },
+ {
+ "epoch": 6.55,
+ "learning_rate": 1.9157088122605367e-05,
+ "loss": 0.6216,
+ "step": 190
+ },
+ {
+ "epoch": 6.9,
+ "learning_rate": 1.7241379310344828e-05,
+ "loss": 0.6214,
+ "step": 200
+ },
+ {
+ "epoch": 7.0,
+ "eval_accuracy": 0.7481203007518797,
+ "eval_loss": 0.6711514592170715,
+ "eval_runtime": 13.3792,
+ "eval_samples_per_second": 19.882,
+ "eval_steps_per_second": 1.271,
+ "step": 203
+ },
+ {
+ "epoch": 7.24,
+ "learning_rate": 1.532567049808429e-05,
+ "loss": 0.6385,
+ "step": 210
+ },
+ {
+ "epoch": 7.59,
+ "learning_rate": 1.3409961685823755e-05,
+ "loss": 0.6202,
+ "step": 220
+ },
+ {
+ "epoch": 7.93,
+ "learning_rate": 1.1494252873563218e-05,
+ "loss": 0.5911,
+ "step": 230
+ },
+ {
+ "epoch": 8.0,
+ "eval_accuracy": 0.7518796992481203,
+ "eval_loss": 0.6812042593955994,
+ "eval_runtime": 14.3277,
+ "eval_samples_per_second": 18.565,
+ "eval_steps_per_second": 1.187,
+ "step": 232
+ },
+ {
+ "epoch": 8.28,
+ "learning_rate": 9.578544061302683e-06,
+ "loss": 0.5925,
+ "step": 240
+ },
+ {
+ "epoch": 8.62,
+ "learning_rate": 7.662835249042145e-06,
+ "loss": 0.5711,
+ "step": 250
+ },
+ {
+ "epoch": 8.97,
+ "learning_rate": 5.747126436781609e-06,
+ "loss": 0.6169,
+ "step": 260
+ },
+ {
+ "epoch": 9.0,
+ "eval_accuracy": 0.7481203007518797,
+ "eval_loss": 0.7047642469406128,
+ "eval_runtime": 17.1552,
+ "eval_samples_per_second": 15.505,
+ "eval_steps_per_second": 0.991,
+ "step": 261
+ },
+ {
+ "epoch": 9.31,
+ "learning_rate": 3.8314176245210725e-06,
+ "loss": 0.6163,
+ "step": 270
+ },
+ {
+ "epoch": 9.66,
+ "learning_rate": 1.9157088122605362e-06,
+ "loss": 0.5672,
+ "step": 280
+ },
+ {
+ "epoch": 10.0,
+ "learning_rate": 0.0,
+ "loss": 0.5863,
+ "step": 290
+ },
+ {
+ "epoch": 10.0,
+ "eval_accuracy": 0.7406015037593985,
+ "eval_loss": 0.7278200387954712,
+ "eval_runtime": 12.3926,
+ "eval_samples_per_second": 21.464,
+ "eval_steps_per_second": 1.372,
+ "step": 290
+ },
+ {
+ "epoch": 10.0,
+ "step": 290,
+ "total_flos": 1.430527770561577e+18,
+ "train_loss": 0.7178522997889025,
+ "train_runtime": 2833.88,
+ "train_samples_per_second": 6.514,
+ "train_steps_per_second": 0.102
+ }
+ ],
+ "logging_steps": 10,
+ "max_steps": 290,
+ "num_train_epochs": 10,
+ "save_steps": 500,
+ "total_flos": 1.430527770561577e+18,
+ "trial_name": null,
+ "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:321bf62f0bb828ae9b9a88c70aa7a7f83bb62da583e16d3a70442dd7fa6e30ef
+size 4536