Spaces:

xu-song
/

tokenizer-arena

Running

xu-song commited on Mar 13

Commit

057bc67

•

1 Parent(s): 5db13e0

add xlm-roberta

Files changed (2) hide show

vocab/__init__.py CHANGED Viewed

@@ -116,6 +116,7 @@ all_tokenizers = [
     ("falcon_180b", "", "sentencepiece"),
     ("skywork_13b_base",),
     ("skywork_13b_math",),
     # "goat",
     # ##### glm系列
@@ -140,6 +141,7 @@ all_tokenizers = [
     ("mistral_7b",),
     ("mixtral_8_7b",),
     ("flan_t5_base",),
     ("fastchat_t5_3b",),
     ("pko_t5_large",),

     ("falcon_180b", "", "sentencepiece"),
     ("skywork_13b_base",),
     ("skywork_13b_math",),
+    ("xlm_roberta", ),
     # "goat",
     # ##### glm系列
     ("mistral_7b",),
     ("mixtral_8_7b",),
     ("flan_t5_base",),
     ("fastchat_t5_3b",),
     ("pko_t5_large",),

vocab/xlm_roberta/__init__.py ADDED Viewed


1	+ from transformers import AutoTokenizer
2	+
3	+ tokenizer = AutoTokenizer.from_pretrained("FacebookAI/xlm-roberta-base", trust_remote_code=True)