Update text encoder model

Browse files

Files changed (6) hide show

config.json +1 -1
output_linear.bin +2 -2
pytorch_model.bin +1 -1
tokenizer_config.json +1 -1
training_args_1.json → training_args-1.json +12 -6
training_args_2.json → training_args-2.json +10 -4

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "sonoisa/clip-vit-b-32-japanese",
   "architectures": [
     "BertModel"
   ],

 {
+  "_name_or_path": "sonoisa/clip-vit-b-32-japanese-v1",
   "architectures": [
     "BertModel"
   ],

output_linear.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d49a6e24d051ee5dc3490ed4927513abd4c46e32bc479188b00648e1ef311a4d
-size 4721639

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f134e1c5be9cac7be1bbd3d750774d3f5ab7166fb79f7a17565734a99fee1ad
+size 9440231

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:762c0f6542b607e5f606ce41f21ca995cc456a0ab1c9bbf507f75d022add985a
 size 442547953

 version https://git-lfs.github.com/spec/v1
+oid sha256:69eb2a48e8e40f927229f04fa5feb871f2aa148c1705f7011ee4c1defa435d87
 size 442547953

tokenizer_config.json CHANGED Viewed

@@ -1 +1 @@

- {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "do_lower_case": true, "do_word_tokenize": true, "do_subword_tokenize": true, "word_tokenizer_type": "mecab", "subword_tokenizer_type": "wordpiece", "never_split": null, "mecab_kwargs": null, "~~is_fast": true, "~~model_max_length": 512, "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "sonoisa/clip-vit-b-32-japanese", "tokenizer_class": "BertJapaneseTokenizer"}

+ {"unk_token": "[UNK]", "sep_token": "[SEP]", "pad_token": "[PAD]", "cls_token": "[CLS]", "mask_token": "[MASK]", "do_lower_case": true, "do_word_tokenize": true, "do_subword_tokenize": true, "word_tokenizer_type": "mecab", "subword_tokenizer_type": "wordpiece", "never_split": null, "mecab_kwargs": null, "model_max_length": 512, "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "sonoisa/clip-vit-b-32-japanese-v1", "is_fast": true, "tokenizer_class": "BertJapaneseTokenizer"}

training_args_1.json → training_args-1.json RENAMED Viewed

@@ -2,19 +2,25 @@
     "adam_epsilon": 1e-08,
     "data_dir": "/content/data",
     "early_stop_callback": false,
     "eval_batch_size": 32,
     "fp_16": false,
-    "gradient_accumulation_steps": 4,
     "learning_rate": 0.001,
     "max_grad_norm": 1.0,
     "max_input_length": 64,
-    "model_name_or_path": "cl-tohoku/bert-base-japanese-whole-word-masking",
     "n_gpu": 1,
-    "num_train_epochs": 1,
     "seed": 42,
     "shuffle_buffer_size": 65536,
-    "tokenizer_name_or_path": "cl-tohoku/bert-base-japanese-whole-word-masking",
-    "train_batch_size": 256,
-    "warmup_ratio": 0.05,
     "weight_decay": 0.0
 }

     "adam_epsilon": 1e-08,
     "data_dir": "/content/data",
     "early_stop_callback": false,
+    "en_ja_ratio": 4,
     "eval_batch_size": 32,
     "fp_16": false,
+    "freeze_bert": true,
+    "from_pretrained_bert": true,
+    "gradient_accumulation_steps": 1,
     "learning_rate": 0.001,
+    "lr_initial_epoch": 0,
+    "lr_total_epochs": 4,
+    "lr_warmup_epochs": 0.05,
+    "max_cls_depth": 6,
     "max_grad_norm": 1.0,
     "max_input_length": 64,
+    "model_name_or_path": "sonoisa/sentence-bert-base-ja-mean-tokens-v2",
     "n_gpu": 1,
+    "num_train_epochs": 4,
     "seed": 42,
     "shuffle_buffer_size": 65536,
+    "tokenizer_name_or_path": "sonoisa/sentence-bert-base-ja-mean-tokens-v2",
+    "train_batch_size": 2560,
     "weight_decay": 0.0
 }

training_args_2.json → training_args-2.json RENAMED Viewed

@@ -2,19 +2,25 @@
     "adam_epsilon": 1e-08,
     "data_dir": "/content/data",
     "early_stop_callback": false,
     "eval_batch_size": 32,
     "fp_16": false,
     "gradient_accumulation_steps": 4,
-    "learning_rate": 0.0002,
     "max_grad_norm": 1.0,
     "max_input_length": 64,
     "model_name_or_path": "/content/pretrain_model",
     "n_gpu": 1,
-    "num_train_epochs": 1,
-    "seed": 12345,
     "shuffle_buffer_size": 65536,
     "tokenizer_name_or_path": "/content/pretrain_model",
     "train_batch_size": 256,
-    "warmup_ratio": 0.05,
     "weight_decay": 0.0
 }

     "adam_epsilon": 1e-08,
     "data_dir": "/content/data",
     "early_stop_callback": false,
+    "en_ja_ratio": 4,
     "eval_batch_size": 32,
     "fp_16": false,
+    "freeze_bert": false,
+    "from_pretrained_bert": false,
     "gradient_accumulation_steps": 4,
+    "learning_rate": 0.0004,
+    "lr_initial_epoch": 0,
+    "lr_total_epochs": 4,
+    "lr_warmup_epochs": 0.05,
+    "max_cls_depth": 6,
     "max_grad_norm": 1.0,
     "max_input_length": 64,
     "model_name_or_path": "/content/pretrain_model",
     "n_gpu": 1,
+    "num_train_epochs": 4,
+    "seed": 1234,
     "shuffle_buffer_size": 65536,
     "tokenizer_name_or_path": "/content/pretrain_model",
     "train_batch_size": 256,
     "weight_decay": 0.0
 }