KoichiYasuoka
/

RakutenAI-7B-upos

Token Classification

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

KoichiYasuoka commited on Jul 11

Commit

353db10

•

1 Parent(s): 7a3c511

bug fix

Files changed (2) hide show

config.json +1 -1
maker.sh +2 -2

config.json CHANGED Viewed

@@ -153,7 +153,7 @@
   },
   "max_position_embeddings": 32768,
   "mlp_bias": false,
-  "model_type": "llama",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,

   },
   "max_position_embeddings": 32768,
   "mlp_bias": false,
+  "model_type": "mistral",
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,

maker.sh CHANGED Viewed

@@ -8,11 +8,11 @@ then TMPA=./maker$$a.py
 src="Rakuten/RakutenAI-7B"
 tgt="exRakutenAI-7B"
 import json,torch,unicodedata
-from transformers import LlamaTokenizerFast,LlamaForCausalLM
 tkz=LlamaTokenizerFast.from_pretrained(src,cls_token="<s>",sep_token="<s>",mask_token="<unk>",pad_token="</s>")
 d=json.loads(tkz.backend_tokenizer.to_str())
 tkz.backend_tokenizer.from_str(json.dumps(d)).save("tokenizer.json")
-mdl=LlamaForCausalLM.from_pretrained(src)
 tkz=LlamaTokenizerFast(tokenizer_file="tokenizer.json",model_max_length=mdl.config.max_position_embeddings,cls_token="<s>",sep_token="<s>",mask_token="<unk>",pad_token="</s>")
 e=mdl.resize_token_embeddings(len(tkz))
 f=mdl.get_output_embeddings()

 src="Rakuten/RakutenAI-7B"
 tgt="exRakutenAI-7B"
 import json,torch,unicodedata
+from transformers import LlamaTokenizerFast,MistralForCausalLM
 tkz=LlamaTokenizerFast.from_pretrained(src,cls_token="<s>",sep_token="<s>",mask_token="<unk>",pad_token="</s>")
 d=json.loads(tkz.backend_tokenizer.to_str())
 tkz.backend_tokenizer.from_str(json.dumps(d)).save("tokenizer.json")
+mdl=MistralForCausalLM.from_pretrained(src)
 tkz=LlamaTokenizerFast(tokenizer_file="tokenizer.json",model_max_length=mdl.config.max_position_embeddings,cls_token="<s>",sep_token="<s>",mask_token="<unk>",pad_token="</s>")
 e=mdl.resize_token_embeddings(len(tkz))
 f=mdl.get_output_embeddings()