Upload 9 files

Browse files

Files changed (9) hide show

checkpoint-9500/config.json +108 -0
checkpoint-9500/optimizer.pt +3 -0
checkpoint-9500/preprocessor_config.json +10 -0
checkpoint-9500/pytorch_model.bin +3 -0
checkpoint-9500/rng_state.pth +3 -0
checkpoint-9500/scaler.pt +3 -0
checkpoint-9500/scheduler.pt +3 -0
checkpoint-9500/trainer_state.json +301 -0
checkpoint-9500/training_args.bin +3 -0

checkpoint-9500/config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "nguyenvulebinh/wav2vec2-base-vietnamese-250h",
+  "activation_dropout": 0.1,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 107,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.20.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 110,
+  "xvector_output_dim": 512
+}

checkpoint-9500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69819c23f01b77d9c63b7b338595efe429cc99705a5032497d4d3b1a1bd04b8c
+size 722166405

checkpoint-9500/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

checkpoint-9500/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f130d659275463be357bce6d7ae08f5c4f98a6f4b2384ee68456ed8ccf509e2c
+size 377898657

checkpoint-9500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1990a5c4ded0f73f95570e0aaaf64573202b83065f1d0c544f25826d39399ca1
+size 14639

checkpoint-9500/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0396645081caca9a8e87b2fc203d6448c90f0c7640480c5ac0e5c60db3c169bb
+size 557

checkpoint-9500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb1950d337e6b1b8419fd4218ba925380620dd9415d10a2e1ea1235e6715eb62
+size 627

checkpoint-9500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,301 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 12.683578104138851,
+  "global_step": 9500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.67,
+      "learning_rate": 4.9500000000000004e-05,
+      "loss": 13.7697,
+      "step": 500
+    },
+    {
+      "epoch": 0.67,
+      "eval_loss": 3.130753755569458,
+      "eval_runtime": 142.0908,
+      "eval_samples_per_second": 10.543,
+      "eval_steps_per_second": 1.323,
+      "eval_wer": 1.0547889135773594,
+      "step": 500
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 9.95e-05,
+      "loss": 2.5213,
+      "step": 1000
+    },
+    {
+      "epoch": 1.34,
+      "eval_loss": 1.1151297092437744,
+      "eval_runtime": 142.3636,
+      "eval_samples_per_second": 10.522,
+      "eval_steps_per_second": 1.321,
+      "eval_wer": 0.5353175067243597,
+      "step": 1000
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 9.478178368121443e-05,
+      "loss": 1.2366,
+      "step": 1500
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.6335494518280029,
+      "eval_runtime": 141.3238,
+      "eval_samples_per_second": 10.6,
+      "eval_steps_per_second": 1.33,
+      "eval_wer": 0.32534206525552567,
+      "step": 1500
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 8.951085810668353e-05,
+      "loss": 0.8513,
+      "step": 2000
+    },
+    {
+      "epoch": 2.67,
+      "eval_loss": 0.4479542076587677,
+      "eval_runtime": 141.529,
+      "eval_samples_per_second": 10.584,
+      "eval_steps_per_second": 1.328,
+      "eval_wer": 0.2673956262425447,
+      "step": 2000
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 8.423993253215266e-05,
+      "loss": 0.6485,
+      "step": 2500
+    },
+    {
+      "epoch": 3.34,
+      "eval_loss": 0.3942696750164032,
+      "eval_runtime": 142.7432,
+      "eval_samples_per_second": 10.494,
+      "eval_steps_per_second": 1.317,
+      "eval_wer": 0.24038124196000468,
+      "step": 2500
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 7.896900695762176e-05,
+      "loss": 0.5742,
+      "step": 3000
+    },
+    {
+      "epoch": 4.01,
+      "eval_loss": 0.3576195538043976,
+      "eval_runtime": 141.7609,
+      "eval_samples_per_second": 10.567,
+      "eval_steps_per_second": 1.326,
+      "eval_wer": 0.22254707051806807,
+      "step": 3000
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 7.369808138309088e-05,
+      "loss": 0.4864,
+      "step": 3500
+    },
+    {
+      "epoch": 4.67,
+      "eval_loss": 0.3353235721588135,
+      "eval_runtime": 141.2544,
+      "eval_samples_per_second": 10.605,
+      "eval_steps_per_second": 1.331,
+      "eval_wer": 0.2099169687755818,
+      "step": 3500
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 6.842715580855998e-05,
+      "loss": 0.4255,
+      "step": 4000
+    },
+    {
+      "epoch": 5.34,
+      "eval_loss": 0.30898207426071167,
+      "eval_runtime": 141.0567,
+      "eval_samples_per_second": 10.62,
+      "eval_steps_per_second": 1.333,
+      "eval_wer": 0.1951818500760145,
+      "step": 4000
+    },
+    {
+      "epoch": 6.01,
+      "learning_rate": 6.316677208517816e-05,
+      "loss": 0.4415,
+      "step": 4500
+    },
+    {
+      "epoch": 6.01,
+      "eval_loss": 0.28900569677352905,
+      "eval_runtime": 141.7282,
+      "eval_samples_per_second": 10.57,
+      "eval_steps_per_second": 1.326,
+      "eval_wer": 0.18986083499005965,
+      "step": 4500
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 5.790638836179634e-05,
+      "loss": 0.3936,
+      "step": 5000
+    },
+    {
+      "epoch": 6.68,
+      "eval_loss": 0.29400354623794556,
+      "eval_runtime": 141.7038,
+      "eval_samples_per_second": 10.571,
+      "eval_steps_per_second": 1.327,
+      "eval_wer": 0.17980353175067243,
+      "step": 5000
+    },
+    {
+      "epoch": 7.34,
+      "learning_rate": 5.2635462787265446e-05,
+      "loss": 0.3539,
+      "step": 5500
+    },
+    {
+      "epoch": 7.34,
+      "eval_loss": 0.28268352150917053,
+      "eval_runtime": 143.4799,
+      "eval_samples_per_second": 10.44,
+      "eval_steps_per_second": 1.31,
+      "eval_wer": 0.17477488013097883,
+      "step": 5500
+    },
+    {
+      "epoch": 8.01,
+      "learning_rate": 4.736453721273456e-05,
+      "loss": 0.3731,
+      "step": 6000
+    },
+    {
+      "epoch": 8.01,
+      "eval_loss": 0.27123069763183594,
+      "eval_runtime": 144.4362,
+      "eval_samples_per_second": 10.371,
+      "eval_steps_per_second": 1.302,
+      "eval_wer": 0.16851830195298795,
+      "step": 6000
+    },
+    {
+      "epoch": 8.68,
+      "learning_rate": 4.209361163820367e-05,
+      "loss": 0.3003,
+      "step": 6500
+    },
+    {
+      "epoch": 8.68,
+      "eval_loss": 0.2683442533016205,
+      "eval_runtime": 144.0393,
+      "eval_samples_per_second": 10.4,
+      "eval_steps_per_second": 1.305,
+      "eval_wer": 0.16927844696526723,
+      "step": 6500
+    },
+    {
+      "epoch": 9.35,
+      "learning_rate": 3.6822686063672785e-05,
+      "loss": 0.2858,
+      "step": 7000
+    },
+    {
+      "epoch": 9.35,
+      "eval_loss": 0.2772638499736786,
+      "eval_runtime": 144.5546,
+      "eval_samples_per_second": 10.363,
+      "eval_steps_per_second": 1.301,
+      "eval_wer": 0.16477604958484388,
+      "step": 7000
+    },
+    {
+      "epoch": 10.01,
+      "learning_rate": 3.15517604891419e-05,
+      "loss": 0.3133,
+      "step": 7500
+    },
+    {
+      "epoch": 10.01,
+      "eval_loss": 0.25764620304107666,
+      "eval_runtime": 142.0521,
+      "eval_samples_per_second": 10.545,
+      "eval_steps_per_second": 1.323,
+      "eval_wer": 0.16325575956028535,
+      "step": 7500
+    },
+    {
+      "epoch": 10.68,
+      "learning_rate": 2.628083491461101e-05,
+      "loss": 0.2803,
+      "step": 8000
+    },
+    {
+      "epoch": 10.68,
+      "eval_loss": 0.2704939544200897,
+      "eval_runtime": 143.5154,
+      "eval_samples_per_second": 10.438,
+      "eval_steps_per_second": 1.31,
+      "eval_wer": 0.16050754297742953,
+      "step": 8000
+    },
+    {
+      "epoch": 11.35,
+      "learning_rate": 2.1009909340080118e-05,
+      "loss": 0.2787,
+      "step": 8500
+    },
+    {
+      "epoch": 11.35,
+      "eval_loss": 0.2567004859447479,
+      "eval_runtime": 143.3412,
+      "eval_samples_per_second": 10.451,
+      "eval_steps_per_second": 1.312,
+      "eval_wer": 0.16062448836393403,
+      "step": 8500
+    },
+    {
+      "epoch": 12.02,
+      "learning_rate": 1.573898376554923e-05,
+      "loss": 0.2302,
+      "step": 9000
+    },
+    {
+      "epoch": 12.02,
+      "eval_loss": 0.24703864753246307,
+      "eval_runtime": 143.5724,
+      "eval_samples_per_second": 10.434,
+      "eval_steps_per_second": 1.309,
+      "eval_wer": 0.15822710794059175,
+      "step": 9000
+    },
+    {
+      "epoch": 12.68,
+      "learning_rate": 1.0468058191018343e-05,
+      "loss": 0.2147,
+      "step": 9500
+    },
+    {
+      "epoch": 12.68,
+      "eval_loss": 0.24555708467960358,
+      "eval_runtime": 142.5225,
+      "eval_samples_per_second": 10.511,
+      "eval_steps_per_second": 1.319,
+      "eval_wer": 0.15717459946205123,
+      "step": 9500
+    }
+  ],
+  "max_steps": 10486,
+  "num_train_epochs": 14,
+  "total_flos": 4.4296766058875546e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-9500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:045f9b5c540095c0c180207709fb8c16c3b9e75203de6a5090c126f7a0ff2334
+size 3323