KoichiYasuoka
commited on
Commit
•
370ef3b
1
Parent(s):
c05358d
model improved
Browse files- tokenizer.json +0 -147
tokenizer.json
CHANGED
@@ -160,41 +160,6 @@
|
|
160 |
},
|
161 |
"content": "ho"
|
162 |
},
|
163 |
-
{
|
164 |
-
"type": "Replace",
|
165 |
-
"pattern": {
|
166 |
-
"String": "ヂャ"
|
167 |
-
},
|
168 |
-
"content": "ja"
|
169 |
-
},
|
170 |
-
{
|
171 |
-
"type": "Replace",
|
172 |
-
"pattern": {
|
173 |
-
"String": "ヂュ"
|
174 |
-
},
|
175 |
-
"content": "ju"
|
176 |
-
},
|
177 |
-
{
|
178 |
-
"type": "Replace",
|
179 |
-
"pattern": {
|
180 |
-
"String": "ヂェ"
|
181 |
-
},
|
182 |
-
"content": "je"
|
183 |
-
},
|
184 |
-
{
|
185 |
-
"type": "Replace",
|
186 |
-
"pattern": {
|
187 |
-
"String": "ヂョ"
|
188 |
-
},
|
189 |
-
"content": "jo"
|
190 |
-
},
|
191 |
-
{
|
192 |
-
"type": "Replace",
|
193 |
-
"pattern": {
|
194 |
-
"String": "ドゥ"
|
195 |
-
},
|
196 |
-
"content": "du"
|
197 |
-
},
|
198 |
{
|
199 |
"type": "Replace",
|
200 |
"pattern": {
|
@@ -230,41 +195,6 @@
|
|
230 |
},
|
231 |
"content": "do"
|
232 |
},
|
233 |
-
{
|
234 |
-
"type": "Replace",
|
235 |
-
"pattern": {
|
236 |
-
"String": "チャ"
|
237 |
-
},
|
238 |
-
"content": "ca"
|
239 |
-
},
|
240 |
-
{
|
241 |
-
"type": "Replace",
|
242 |
-
"pattern": {
|
243 |
-
"String": "チュ"
|
244 |
-
},
|
245 |
-
"content": "cu"
|
246 |
-
},
|
247 |
-
{
|
248 |
-
"type": "Replace",
|
249 |
-
"pattern": {
|
250 |
-
"String": "チェ"
|
251 |
-
},
|
252 |
-
"content": "ce"
|
253 |
-
},
|
254 |
-
{
|
255 |
-
"type": "Replace",
|
256 |
-
"pattern": {
|
257 |
-
"String": "チョ"
|
258 |
-
},
|
259 |
-
"content": "co"
|
260 |
-
},
|
261 |
-
{
|
262 |
-
"type": "Replace",
|
263 |
-
"pattern": {
|
264 |
-
"String": "トゥ"
|
265 |
-
},
|
266 |
-
"content": "tu"
|
267 |
-
},
|
268 |
{
|
269 |
"type": "Replace",
|
270 |
"pattern": {
|
@@ -300,34 +230,6 @@
|
|
300 |
},
|
301 |
"content": "to"
|
302 |
},
|
303 |
-
{
|
304 |
-
"type": "Replace",
|
305 |
-
"pattern": {
|
306 |
-
"String": "ジャ"
|
307 |
-
},
|
308 |
-
"content": "ja"
|
309 |
-
},
|
310 |
-
{
|
311 |
-
"type": "Replace",
|
312 |
-
"pattern": {
|
313 |
-
"String": "ジュ"
|
314 |
-
},
|
315 |
-
"content": "ju"
|
316 |
-
},
|
317 |
-
{
|
318 |
-
"type": "Replace",
|
319 |
-
"pattern": {
|
320 |
-
"String": "ジェ"
|
321 |
-
},
|
322 |
-
"content": "je"
|
323 |
-
},
|
324 |
-
{
|
325 |
-
"type": "Replace",
|
326 |
-
"pattern": {
|
327 |
-
"String": "ジョ"
|
328 |
-
},
|
329 |
-
"content": "jo"
|
330 |
-
},
|
331 |
{
|
332 |
"type": "Replace",
|
333 |
"pattern": {
|
@@ -363,34 +265,6 @@
|
|
363 |
},
|
364 |
"content": "zo"
|
365 |
},
|
366 |
-
{
|
367 |
-
"type": "Replace",
|
368 |
-
"pattern": {
|
369 |
-
"String": "シャ"
|
370 |
-
},
|
371 |
-
"content": "sa"
|
372 |
-
},
|
373 |
-
{
|
374 |
-
"type": "Replace",
|
375 |
-
"pattern": {
|
376 |
-
"String": "シュ"
|
377 |
-
},
|
378 |
-
"content": "su"
|
379 |
-
},
|
380 |
-
{
|
381 |
-
"type": "Replace",
|
382 |
-
"pattern": {
|
383 |
-
"String": "シェ"
|
384 |
-
},
|
385 |
-
"content": "se"
|
386 |
-
},
|
387 |
-
{
|
388 |
-
"type": "Replace",
|
389 |
-
"pattern": {
|
390 |
-
"String": "ショ"
|
391 |
-
},
|
392 |
-
"content": "so"
|
393 |
-
},
|
394 |
{
|
395 |
"type": "Replace",
|
396 |
"pattern": {
|
@@ -643,27 +517,6 @@
|
|
643 |
},
|
644 |
"content": "wa"
|
645 |
},
|
646 |
-
{
|
647 |
-
"type": "Replace",
|
648 |
-
"pattern": {
|
649 |
-
"String": "ウィ"
|
650 |
-
},
|
651 |
-
"content": "wi"
|
652 |
-
},
|
653 |
-
{
|
654 |
-
"type": "Replace",
|
655 |
-
"pattern": {
|
656 |
-
"String": "ウェ"
|
657 |
-
},
|
658 |
-
"content": "we"
|
659 |
-
},
|
660 |
-
{
|
661 |
-
"type": "Replace",
|
662 |
-
"pattern": {
|
663 |
-
"String": "ウォ"
|
664 |
-
},
|
665 |
-
"content": "wo"
|
666 |
-
},
|
667 |
{
|
668 |
"type": "Replace",
|
669 |
"pattern": {
|
|
|
160 |
},
|
161 |
"content": "ho"
|
162 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
163 |
{
|
164 |
"type": "Replace",
|
165 |
"pattern": {
|
|
|
195 |
},
|
196 |
"content": "do"
|
197 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
198 |
{
|
199 |
"type": "Replace",
|
200 |
"pattern": {
|
|
|
230 |
},
|
231 |
"content": "to"
|
232 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
233 |
{
|
234 |
"type": "Replace",
|
235 |
"pattern": {
|
|
|
265 |
},
|
266 |
"content": "zo"
|
267 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
268 |
{
|
269 |
"type": "Replace",
|
270 |
"pattern": {
|
|
|
517 |
},
|
518 |
"content": "wa"
|
519 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
520 |
{
|
521 |
"type": "Replace",
|
522 |
"pattern": {
|