cusomize vilbert-mt for models

Files changed (3) hide show

bert_base_6layer_6conect.json ADDED Viewed

+{
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "max_position_embeddings": 512,
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "type_vocab_size": 2,
+  "vocab_size": 30522,
+  "v_feature_size": 2048,
+  "v_target_size": 1601,
+  "v_hidden_size": 1024,
+  "v_num_hidden_layers":6,
+  "v_num_attention_heads":8,
+  "v_intermediate_size":1024,
+  "bi_hidden_size":1024,
+  "bi_num_attention_heads":8,
+  "bi_intermediate_size": 1024,
+  "bi_attention_type":1,
+  "v_attention_probs_dropout_prob":0.1,
+  "v_hidden_act":"gelu",
+  "v_hidden_dropout_prob":0.1,
+  "v_initializer_range":0.02,
+  "v_biattention_id":[0, 1, 2, 3, 4, 5],
+  "t_biattention_id":[6, 7, 8, 9, 10, 11],
+  "pooling_method": "mul"
+}

config.json ADDED Viewed

+{
+  "model_type": "vilbert",
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "max_position_embeddings": 512,
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "type_vocab_size": 2,
+  "vocab_size": 30522,
+  "v_feature_size": 2048,
+  "v_target_size": 1601,
+  "v_hidden_size": 1024,
+  "v_num_hidden_layers":6,
+  "v_num_attention_heads":8,
+  "v_intermediate_size":1024,
+  "bi_hidden_size":1024,
+  "bi_num_attention_heads":8,
+  "bi_intermediate_size": 1024,
+  "bi_attention_type":1,
+  "v_attention_probs_dropout_prob":0.1,
+  "v_hidden_act":"gelu",
+  "v_hidden_dropout_prob":0.1,
+  "v_initializer_range":0.02,
+  "v_biattention_id":[0, 1, 2, 3, 4, 5],
+  "t_biattention_id":[6, 7, 8, 9, 10, 11],
+  "pooling_method": "mul"
+}

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe449aaf047e0d10bf5da7258355c4d0322bbe5fe40ddb82a9e4e13552af5aaa
+size 1072254755