foxxy-hm commited on Aug 29, 2023

Commit

6c08f73

1 Parent(s): 277ae2b

Upload 18 files

Browse files

Files changed (18) hide show

checkpoint-5000/config.json +108 -0
checkpoint-5000/optimizer.pt +3 -0
checkpoint-5000/preprocessor_config.json +9 -0
checkpoint-5000/pytorch_model.bin +3 -0
checkpoint-5000/rng_state.pth +3 -0
checkpoint-5000/scaler.pt +3 -0
checkpoint-5000/scheduler.pt +3 -0
checkpoint-5000/trainer_state.json +166 -0
checkpoint-5000/training_args.bin +3 -0
checkpoint-5500/config.json +108 -0
checkpoint-5500/optimizer.pt +3 -0
checkpoint-5500/preprocessor_config.json +9 -0
checkpoint-5500/pytorch_model.bin +3 -0
checkpoint-5500/rng_state.pth +3 -0
checkpoint-5500/scaler.pt +3 -0
checkpoint-5500/scheduler.pt +3 -0
checkpoint-5500/trainer_state.json +181 -0
checkpoint-5500/training_args.bin +3 -0

checkpoint-5000/config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "nguyenvulebinh/wav2vec2-base-vietnamese-250h",
+  "activation_dropout": 0.1,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 109,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.20.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 110,
+  "xvector_output_dim": 512
+}

checkpoint-5000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ab61a3ea59b0477d6157c5e36bd4b35b009623ffc8a6e3970cf68ac71835ba8
+size 722166405

checkpoint-5000/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

checkpoint-5000/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6416c9220620122566fbcaa34f9297a3c0e0893728cbe8aff75ecc725cba0962
+size 377898657

checkpoint-5000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9289719fe6aa89c43eed5a0c5e1788f88e24188a9e80ecc8f2549914393286db
+size 14639

checkpoint-5000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7c0dce48d9ccf7788e0ef646b9c8cf20b95ce1eca7ffe98d50c1b7c3f95d77f
+size 557

checkpoint-5000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5db4db3085ce59d670b78bcb8124e1a0fa73c1d33e29a3507004c094fd177e7f
+size 627

checkpoint-5000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,166 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.3377837116154874,
+  "global_step": 5000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.9800000000000004e-05,
+      "loss": 1.0211,
+      "step": 500
+    },
+    {
+      "epoch": 0.33,
+      "eval_loss": 0.5140587091445923,
+      "eval_runtime": 112.0215,
+      "eval_samples_per_second": 13.372,
+      "eval_steps_per_second": 1.678,
+      "eval_wer": 0.32459210916641945,
+      "step": 500
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 9.98e-05,
+      "loss": 0.7098,
+      "step": 1000
+    },
+    {
+      "epoch": 0.67,
+      "eval_loss": 0.41307497024536133,
+      "eval_runtime": 114.0249,
+      "eval_samples_per_second": 13.137,
+      "eval_steps_per_second": 1.649,
+      "eval_wer": 0.2981311183625037,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.002403846153846e-05,
+      "loss": 0.6115,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.37654194235801697,
+      "eval_runtime": 115.4275,
+      "eval_samples_per_second": 12.978,
+      "eval_steps_per_second": 1.629,
+      "eval_wer": 0.2660338178582023,
+      "step": 1500
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 8.000801282051282e-05,
+      "loss": 0.5112,
+      "step": 2000
+    },
+    {
+      "epoch": 1.34,
+      "eval_loss": 0.3202863931655884,
+      "eval_runtime": 113.0512,
+      "eval_samples_per_second": 13.251,
+      "eval_steps_per_second": 1.663,
+      "eval_wer": 0.24526846633046573,
+      "step": 2000
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 7.001201923076923e-05,
+      "loss": 0.4763,
+      "step": 2500
+    },
+    {
+      "epoch": 1.67,
+      "eval_loss": 0.29251885414123535,
+      "eval_runtime": 113.4478,
+      "eval_samples_per_second": 13.204,
+      "eval_steps_per_second": 1.657,
+      "eval_wer": 0.23500444971818452,
+      "step": 2500
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 5.999599358974359e-05,
+      "loss": 0.4386,
+      "step": 3000
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.2935383915901184,
+      "eval_runtime": 112.4069,
+      "eval_samples_per_second": 13.327,
+      "eval_steps_per_second": 1.672,
+      "eval_wer": 0.22284188668051022,
+      "step": 3000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 4.997996794871795e-05,
+      "loss": 0.3802,
+      "step": 3500
+    },
+    {
+      "epoch": 2.34,
+      "eval_loss": 0.2789919078350067,
+      "eval_runtime": 111.4408,
+      "eval_samples_per_second": 13.442,
+      "eval_steps_per_second": 1.687,
+      "eval_wer": 0.21388312073568674,
+      "step": 3500
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 3.998397435897436e-05,
+      "loss": 0.3727,
+      "step": 4000
+    },
+    {
+      "epoch": 2.67,
+      "eval_loss": 0.26136162877082825,
+      "eval_runtime": 111.228,
+      "eval_samples_per_second": 13.468,
+      "eval_steps_per_second": 1.69,
+      "eval_wer": 0.21050133491545536,
+      "step": 4000
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 2.9967948717948717e-05,
+      "loss": 0.3747,
+      "step": 4500
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.24868248403072357,
+      "eval_runtime": 112.653,
+      "eval_samples_per_second": 13.297,
+      "eval_steps_per_second": 1.669,
+      "eval_wer": 0.20539899139721152,
+      "step": 4500
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 1.9951923076923078e-05,
+      "loss": 0.3192,
+      "step": 5000
+    },
+    {
+      "epoch": 3.34,
+      "eval_loss": 0.2479962557554245,
+      "eval_runtime": 117.7279,
+      "eval_samples_per_second": 12.724,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.20166122812221893,
+      "step": 5000
+    }
+  ],
+  "max_steps": 5992,
+  "num_train_epochs": 4,
+  "total_flos": 1.2902768061426483e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-5000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9bc6476f18e70f806c108d7c1e7515c1712aeba84566834c0c576bb35f1bd321
+size 3323

checkpoint-5500/config.json ADDED Viewed

	@@ -0,0 +1,108 @@

+{
+  "_name_or_path": "nguyenvulebinh/wav2vec2-base-vietnamese-250h",
+  "activation_dropout": 0.1,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 109,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.20.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 110,
+  "xvector_output_dim": 512
+}

checkpoint-5500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee7b1649037408d7555e48dd7a38b066ca7a7d0e18cf0fe1122f552518d36080
+size 722166405

checkpoint-5500/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

checkpoint-5500/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:03398881073b70b1f797a6ced8f2fd6befa31a9c40027031d8ae9e93f8a856fa
+size 377898657

checkpoint-5500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0768686ec19ae0847e16bf663f06a4e063a9f43cb22ae48878bf1765cf467121
+size 14639

checkpoint-5500/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a64317940bdef3bf2f71d94b0d5bcbf9f5d73db0bee2e5813533e8952d8f9bda
+size 557

checkpoint-5500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2f7a4123b7778069a040345365fa3eb30cd916ad62b115635d7e49f6d53ae9ac
+size 627

checkpoint-5500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,181 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.671562082777036,
+  "global_step": 5500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.33,
+      "learning_rate": 4.9800000000000004e-05,
+      "loss": 1.0211,
+      "step": 500
+    },
+    {
+      "epoch": 0.33,
+      "eval_loss": 0.5140587091445923,
+      "eval_runtime": 112.0215,
+      "eval_samples_per_second": 13.372,
+      "eval_steps_per_second": 1.678,
+      "eval_wer": 0.32459210916641945,
+      "step": 500
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 9.98e-05,
+      "loss": 0.7098,
+      "step": 1000
+    },
+    {
+      "epoch": 0.67,
+      "eval_loss": 0.41307497024536133,
+      "eval_runtime": 114.0249,
+      "eval_samples_per_second": 13.137,
+      "eval_steps_per_second": 1.649,
+      "eval_wer": 0.2981311183625037,
+      "step": 1000
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.002403846153846e-05,
+      "loss": 0.6115,
+      "step": 1500
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.37654194235801697,
+      "eval_runtime": 115.4275,
+      "eval_samples_per_second": 12.978,
+      "eval_steps_per_second": 1.629,
+      "eval_wer": 0.2660338178582023,
+      "step": 1500
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 8.000801282051282e-05,
+      "loss": 0.5112,
+      "step": 2000
+    },
+    {
+      "epoch": 1.34,
+      "eval_loss": 0.3202863931655884,
+      "eval_runtime": 113.0512,
+      "eval_samples_per_second": 13.251,
+      "eval_steps_per_second": 1.663,
+      "eval_wer": 0.24526846633046573,
+      "step": 2000
+    },
+    {
+      "epoch": 1.67,
+      "learning_rate": 7.001201923076923e-05,
+      "loss": 0.4763,
+      "step": 2500
+    },
+    {
+      "epoch": 1.67,
+      "eval_loss": 0.29251885414123535,
+      "eval_runtime": 113.4478,
+      "eval_samples_per_second": 13.204,
+      "eval_steps_per_second": 1.657,
+      "eval_wer": 0.23500444971818452,
+      "step": 2500
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 5.999599358974359e-05,
+      "loss": 0.4386,
+      "step": 3000
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.2935383915901184,
+      "eval_runtime": 112.4069,
+      "eval_samples_per_second": 13.327,
+      "eval_steps_per_second": 1.672,
+      "eval_wer": 0.22284188668051022,
+      "step": 3000
+    },
+    {
+      "epoch": 2.34,
+      "learning_rate": 4.997996794871795e-05,
+      "loss": 0.3802,
+      "step": 3500
+    },
+    {
+      "epoch": 2.34,
+      "eval_loss": 0.2789919078350067,
+      "eval_runtime": 111.4408,
+      "eval_samples_per_second": 13.442,
+      "eval_steps_per_second": 1.687,
+      "eval_wer": 0.21388312073568674,
+      "step": 3500
+    },
+    {
+      "epoch": 2.67,
+      "learning_rate": 3.998397435897436e-05,
+      "loss": 0.3727,
+      "step": 4000
+    },
+    {
+      "epoch": 2.67,
+      "eval_loss": 0.26136162877082825,
+      "eval_runtime": 111.228,
+      "eval_samples_per_second": 13.468,
+      "eval_steps_per_second": 1.69,
+      "eval_wer": 0.21050133491545536,
+      "step": 4000
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 2.9967948717948717e-05,
+      "loss": 0.3747,
+      "step": 4500
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.24868248403072357,
+      "eval_runtime": 112.653,
+      "eval_samples_per_second": 13.297,
+      "eval_steps_per_second": 1.669,
+      "eval_wer": 0.20539899139721152,
+      "step": 4500
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 1.9951923076923078e-05,
+      "loss": 0.3192,
+      "step": 5000
+    },
+    {
+      "epoch": 3.34,
+      "eval_loss": 0.2479962557554245,
+      "eval_runtime": 117.7279,
+      "eval_samples_per_second": 12.724,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.20166122812221893,
+      "step": 5000
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 9.935897435897435e-06,
+      "loss": 0.2852,
+      "step": 5500
+    },
+    {
+      "epoch": 3.67,
+      "eval_loss": 0.24946188926696777,
+      "eval_runtime": 116.0708,
+      "eval_samples_per_second": 12.906,
+      "eval_steps_per_second": 1.62,
+      "eval_wer": 0.20005932957579353,
+      "step": 5500
+    }
+  ],
+  "max_steps": 5992,
+  "num_train_epochs": 4,
+  "total_flos": 1.4196823993181012e+18,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-5500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9bc6476f18e70f806c108d7c1e7515c1712aeba84566834c0c576bb35f1bd321
+size 3323