make `tokenizer_class` same as the actual class name

Hi. Recent versions of transformers library log a warning if `tokenizer_class` is different from the actual class name.
If there is no special reason, can you make them equal? Thanks.

For reference: https://github.com/huggingface/transformers/blob/v4.44.0/src/transformers/tokenization_utils_base.py#L2398-L2404

Files changed (1) hide show

tokenizer_config.json +1 -1

tokenizer_config.json CHANGED Viewed

@@ -17,7 +17,7 @@
        "__type":"AddedToken"
     },
     "tokenize_chinese_chars":false,
-    "tokenizer_class": "BertJapaneseTokenizer",
     "word_tokenizer_type": "mecab",
     "subword_tokenizer_type": "sentencepiece",
     "mecab_kwargs": {

        "__type":"AddedToken"
     },
     "tokenize_chinese_chars":false,
+    "tokenizer_class": "DistilBertJapaneseTokenizer",
     "word_tokenizer_type": "mecab",
     "subword_tokenizer_type": "sentencepiece",
     "mecab_kwargs": {