Add SetFit model

Browse files

Files changed (7) hide show

1_Pooling/config.json +2 -2
config.json +1 -1
config_sentence_transformers.json +2 -2
model_head.pkl +2 -2
pytorch_model.bin +1 -1
tokenizer.json +77 -18
tokenizer_config.json +58 -7

1_Pooling/config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "word_embedding_dimension": 768,
-  "pooling_mode_cls_token": true,
-  "pooling_mode_mean_tokens": false,
   "pooling_mode_max_tokens": false,
   "pooling_mode_mean_sqrt_len_tokens": false
 }

 {
   "word_embedding_dimension": 768,
+  "pooling_mode_cls_token": false,
+  "pooling_mode_mean_tokens": true,
   "pooling_mode_max_tokens": false,
   "pooling_mode_mean_sqrt_len_tokens": false
 }

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "C:\\Users\\samue/.cache\\torch\\sentence_transformers\\sentence-transformers_multi-qa-mpnet-base-dot-v1\\",
   "architectures": [
     "MPNetModel"
   ],

 {
+  "_name_or_path": "C:\\Users\\samue/.cache\\torch\\sentence_transformers\\sentence-transformers_paraphrase-mpnet-base-v2\\",
   "architectures": [
     "MPNetModel"
   ],

config_sentence_transformers.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "__version__": {
     "sentence_transformers": "2.0.0",
-    "transformers": "4.6.1",
-    "pytorch": "1.8.1"
   }
 }

 {
   "__version__": {
     "sentence_transformers": "2.0.0",
+    "transformers": "4.7.0",
+    "pytorch": "1.9.0+cu102"
   }
 }

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:119b499d6ce490667c85b59fc0cbc03e4b9552b6b15405d53469f0d33bf851e9
-size 50039

 version https://git-lfs.github.com/spec/v1
+oid sha256:4104549a340069dc3fda2c98a5b2f54bf8507e548a36700a8144bb1a0289cb8f
+size 939248

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0317957b6b4e5ce389a1ba706411a4dc4dd0b20d5c7ab473ae80667dff0e91c3
 size 438016493

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6e57151b75d153e392c54726261061a8df8062b509556a9b242e35e127cc006
 size 438016493

tokenizer.json CHANGED Viewed

@@ -42,15 +42,6 @@
       "normalized": false,
       "special": true
     },
-    {
-      "id": 3,
-      "content": "<unk>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": true,
-      "special": true
-    },
     {
       "id": 104,
       "content": "[UNK]",
@@ -81,17 +72,85 @@
     "type": "BertPreTokenizer"
   },
   "post_processor": {
-    "type": "RobertaProcessing",
-    "sep": [
-      "</s>",
-      2
     ],
-    "cls": [
-      "<s>",
-      0
     ],
-    "trim_offsets": true,
-    "add_prefix_space": false
   },
   "decoder": {
     "type": "WordPiece",

       "normalized": false,
       "special": true
     },
     {
       "id": 104,
       "content": "[UNK]",
     "type": "BertPreTokenizer"
   },
   "post_processor": {
+    "type": "TemplateProcessing",
+    "single": [
+      {
+        "SpecialToken": {
+          "id": "<s>",
+          "type_id": 0
+        }
+      },
+      {
+        "Sequence": {
+          "id": "A",
+          "type_id": 0
+        }
+      },
+      {
+        "SpecialToken": {
+          "id": "</s>",
+          "type_id": 0
+        }
+      }
     ],
+    "pair": [
+      {
+        "SpecialToken": {
+          "id": "<s>",
+          "type_id": 0
+        }
+      },
+      {
+        "Sequence": {
+          "id": "A",
+          "type_id": 0
+        }
+      },
+      {
+        "SpecialToken": {
+          "id": "</s>",
+          "type_id": 0
+        }
+      },
+      {
+        "SpecialToken": {
+          "id": "</s>",
+          "type_id": 0
+        }
+      },
+      {
+        "Sequence": {
+          "id": "B",
+          "type_id": 1
+        }
+      },
+      {
+        "SpecialToken": {
+          "id": "</s>",
+          "type_id": 1
+        }
+      }
     ],
+    "special_tokens": {
+      "</s>": {
+        "id": "</s>",
+        "ids": [
+          2
+        ],
+        "tokens": [
+          "</s>"
+        ]
+      },
+      "<s>": {
+        "id": "<s>",
+        "ids": [
+          0
+        ],
+        "tokens": [
+          "<s>"
+        ]
+      }
+    }
   },
   "decoder": {
     "type": "WordPiece",

tokenizer_config.json CHANGED Viewed

@@ -1,15 +1,66 @@
 {
-  "bos_token": "<s>",
   "clean_up_tokenization_spaces": true,
-  "cls_token": "<s>",
   "do_lower_case": true,
-  "eos_token": "</s>",
-  "mask_token": "<mask>",
   "model_max_length": 512,
-  "pad_token": "<pad>",
-  "sep_token": "</s>",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
-  "unk_token": "[UNK]"
 }

 {
+  "bos_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
   "clean_up_tokenization_spaces": true,
+  "cls_token": {
+    "__type": "AddedToken",
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "do_basic_tokenize": true,
   "do_lower_case": true,
+  "eos_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "__type": "AddedToken",
+    "content": "<mask>",
+    "lstrip": true,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
   "model_max_length": 512,
+  "never_split": null,
+  "pad_token": {
+    "__type": "AddedToken",
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "__type": "AddedToken",
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  },
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
+  "unk_token": {
+    "__type": "AddedToken",
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": true,
+    "rstrip": false,
+    "single_word": false
+  }
 }