{
"google-t5/t5-large @ cc100/en": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1124813,
"_n_tokens": 280104,
"_n_chars": 1121360,
"_n_oov_chars": 136,
"oov_ratio": 0.00012128130127702077,
"_oov_charset": "[\"😉\", \"´\", \"⑤\", \"\", \"⑦\", \"¡\", \"🙂\", \"\", \"😥\", \"⑧\", \"…\", \"¦\", \"‑\", \"�\", \"<\", \"{\", \"~\", \"\", \"\", \"}\", \"\", \"③\", \"ñ\", \"^\", \"⑩\", \"ï\"]",
"reversible": false
},
"google/mt5-large @ cc100/en": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1124813,
"_n_tokens": 307881,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"´\", \"⑤\", \"⑧\", \"…\", \"\", \"⑦\", \"③\", \"�\", \"⑩\", \"‑\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/en": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1124813,
"_n_tokens": 648985,
"_n_chars": 1121360,
"_n_oov_chars": 59,
"oov_ratio": 5.261468217164871e-05,
"_oov_charset": "[\"´\", \"⑤\", \"⑧\", \"…\", \"⑦\", \"③\", \"⑩\", \"‑\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/zh-Hans": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2633047,
"_n_tokens": 163519,
"_n_chars": 927311,
"_n_oov_chars": 865446,
"oov_ratio": 0.9332855967415462,
"_oov_charset": "[\"動\", \"编\", \"环\", \"舔\", \"烷\", \"管\", \"班\", \"菱\", \"谋\", \"颊\", \"万\", \"灾\", \"垣\", \"骁\", \"刘\", \"卉\", \"娩\", \"折\", \"棒\", \"谐\", \"董\", \"標\", \"貂\", \"靛\", \"回\", \"萄\", \"盟\", \"露\", \"款\", \"惯\", \"癫\", \"泣\", \"稠\", \"寺\", \"术\", \"凑\", \"馨\", \"肿\", \"%\", \"猪\", \"鹏\", \"麓\", \"吮\", \"匹\", \"吨\", \"臧\", \"斋\", \"尽\", \"韦\", \"蔽\", \"轨\", \"盖\", \"刑\", \"者\", \"坯\", \"逾\", \"弈\", \"头\", \"勉\", \"旭\", \"效\", \"缮\", \"洁\", \"俱\", \"帘\", \"蒙\", \"旷\", \"牌\", \"总\", \"朝\", \"舀\", \" \", \"耻\", \"~\", \"萤\", \"眯\", \"阵\", \"素\", \"嘘\", \"泯\", \"队\", \"臃\", \"淀\", \"誉\", \"歪\", \"永\", \"昊\", \"粥\", \"劾\", \"婚\", \"杜\", \"沾\", \"熹\", \"繁\", \"鹑\", \"州\", \"狙\", \"仆\", \"经\", \"祝\", \"彦\", \"炮\", \"潮\", \"蚂\", \"看\", \"释\", \"节\", \"嘤\", \"屈\", \"母\", \"察\", \"干\", \"娄\", \"蘸\", \"逝\", \"归\", \"掰\", \"实\", \"忍\", \"乏\", \"亦\", \"隆\", \"丸\", \"號\", \"绛\", \"闹\", \"蝇\", \"桓\", \"几\", \"吹\", \"锣\", \"初\", \"狐\", \"革\", \"千\", \"私\", \"甸\", \"靠\", \"苏\", \"妨\", \"膜\", \"斌\", \"其\", \"右\", \"扪\", \"癖\", \"厂\", \"雏\", \"娱\", \"馋\", \"甄\", \"压\", \"呢\", \"疾\", \"瑟\", \"庶\", \"异\", \"阐\", \"卸\", \"蒋\", \"养\", \"件\", \"查\", \"幕\", \"毅\", \"艋\", \"要\", \"汇\", \"莲\", \"窖\", \"佝\", \"門\", \"书\", \"犬\", \"蹲\", \"瞟\", \"偿\", \"挂\", \"得\", \"雇\", \"引\", \"ト\", \"步\", \"呐\", \"热\", \"豁\", \"汛\", \"蟀\", \"狩\", \"爰\", \"与\", \"郑\", \"差\", \"派\", \"浸\", \"湖\", \"说\", \"手\", \"仪\", \"置\", \"碌\", \"曳\", \"蝉\", \"考\", \"漠\", \"絮\", \"廓\", \"紧\", \"务\", \"勒\", \"休\", \"崖\", \"嘈\", \"排\", \"们\", \"迹\", \"劲\", \"揍\", \"摄\", \"路\", \"状\", \"泾\", \"凡\", \"症\", \"谛\", \"轮\", \"仿\", \"盆\", \"囤\", \"挟\", \"眷\", \"唠\", \"于\", \"窿\", \"铺\", \"既\", \"痒\", \"芯\", \"遗\", \"魂\", \"彙\", \"ό\", \"〗\", \"瘠\", \"纨\", \"挫\", \"弧\", \"涂\", \"磨\", \"购\", \"汀\", \"柏\", \"戒\", \"椒\", \"端\", \"杭\", \"莹\", \"稚\", \"柑\", \"姥\", \"峥\", \"津\", \"络\", \"霆\", \"疴\", \"嗲\", \"琴\", \"掳\", \"泛\", \"善\", \"睡\", \"澜\", \"尾\", \"贿\", \"惨\", \"矩\", \"昏\", \"晕\", \"谆\", \"皮\", \"贸\", \"爸\", \"儿\", \"庄\", \"跑\", \"<\", \"猩\", \"起\", \"岑\", \"睫\", \"筷\", \"骤\", \"滕\", \"器\", \"牟\", \"哑\", \"剐\", \"宜\", \"在\", \"周\", \"荣\", \"觑\", \"卍\", \"呕\", \"懂\", \"祖\", \"粗\", \"溉\", \"忿\", \"拘\", \"份\", \"处\", \"境\", \"-\", \"入\", \"百\", \"豪\", \"主\", \"铃\", \"栽\", \"响\", \"罐\", \"赞\", \"啃\", \"鸠\", \"妞\", \"冒\", \"轴\", \"木\", \"幻\", \"表\", \"肥\", \"町\", \"羡\", \"・\", \"臣\", \"喉\", \"男\", \"赔\", \"颤\", \"嘉\", \"「\", \"]\", \"恕\", \"穿\", \"塔\", \"形\", \"戾\", \"弦\", \"汗\", \"搂\", \"丙\", \"么\", \"瘦\", \"岗\", \"隙\", \"咸\", \"让\", \"皿\", \"禅\", \"阔\", \"猾\", \"酣\", \"霉\", \"污\", \"乎\", \"改\", \"体\", \"檀\", \"末\", \"解\", \"惮\", \"杏\", \"提\", \"续\", \"群\", \"纽\", \"酋\", \"岛\", \"樊\", \"逛\", \"挎\", \"翔\", \"拔\", \"蚁\", \"飞\", \"元\", \"又\", \"障\", \"呻\", \"岱\", \"劝\", \"熙\", \"腑\", \"寇\", \"聂\", \"长\", \"赋\", \"艾\", \"魁\", \"福\", \"茨\", \"帅\", \"滩\", \"底\", \"冻\", \"缴\", \"怖\", \"旗\", \"掘\", \"聚\", \"抗\", \"嗅\", \"匆\", \"倏\", \"弓\", \"标\", \"棉\", \"泸\", \"红\", \"脾\", \"丰\", \"绰\", \"惬\", \"呈\", \"蚀\", \"咔\", \"衣\", \"狳\", \"短\", \"蜀\", \"尿\", \"鬣\", \"钉\", \"富\", \"霈\", \"帐\", \"舶\", \"倪\", \"1\", \"婺\", \"喷\", \"堰\", \"蜂\", \"修\", \"食\", \"捏\", \"痊\", \"日\", \"6\", \"Ø\", \"尸\", \"肪\", \"酷\", \"束\", \"帷\", \"橱\", \"!\", \"蛔\", \"爆\", \"质\", \"坛\", \"赎\", \"盛\", \"砺\", \"脚\", \"担\", \"绒\", \"薄\", \"就\", \"述\", \"把\", \"押\", \"哟\", \"猝\", \"党\", \"珍\", \"圳\", \"撕\", \"螂\", \"膨\", \"害\", \"亚\", \"诱\", \"挽\", \"放\", \"侄\", \"肌\", \"惜\", \"乃\", \"换\", \"俗\", \"陋\", \"踹\", \"朦\", \"使\", \"它\", \"斩\", \"钟\", \"宋\", \"诗\", \"鲱\", \"髦\", \"衿\", \"痫\", \"蒂\", \"浮\", \"阂\", \"糊\", \"车\", \"赶\", \"梵\", \"潢\", \"橇\", \"跤\", \"宅\", \"贯\", \"检\", \"优\", \"厕\", \"浪\", \"溺\", \"欸\", \"浩\", \"揽\", \"氧\", \"…\", \"τ\", \"舱\", \"晤\", \"辙\", \"沼\", \"向\", \"墒\", \"穷\", \"旖\", \"揖\", \"刃\", \"丁\", \"东\", \"序\", \"同\", \"弯\", \"舰\", \"唐\", \"齐\", \"皈\", \"忘\", \"溃\", \"蔷\", \"光\", \"粮\", \"你\", \"等\", \"盈\", \"昂\", \"遮\", \"暇\", \"畏\", \"鄯\", \"辈\", \"纂\", \"略\", \"盯\", \"楞\", \"绘\", \"义\", \"缭\", \"妄\", \"笃\", \"避\", \"叨\", \"掺\", \"促\", \"参\", \"胃\", \"嫩\", \"拍\", \"串\", \"榴\", \"咒\", \"桥\", \"诠\", \"追\", \"荐\", \"槿\", \"饭\", \"恪\", \"司\", \"瞒\", \"⑷\", \"雯\", \"拳\", \"殉\", \"舛\", \"逼\", \"预\", \"梢\", \"啜\", \"闺\", \"雌\", \"沐\", \"郅\", \"〕\", \"浆\", \"灵\", \"威\", \"坐\", \"霍\", \"兢\", \"仄\", \"肾\", \"腾\", \"侦\", \"蟹\", \"孩\", \"裕\", \"斑\", \"擀\", \"锯\", \"娛\", \"否\", \"吴\", \"井\", \"音\", \"资\", \"蹊\", \"渤\", \"耘\", \"馁\", \"淞\", \"蔚\", \"拣\", \"溘\", \"取\", \"荻\", \"烟\", \"夸\", \"饮\", \"靡\", \"筒\", \"傥\", \"曲\", \"舆\", \"弥\", \"倨\", \"沸\", \"踝\", \"印\", \"澳\", \"刮\", \"税\", \"告\", \"九\", \"拢\", \"裤\", \"榭\", \"忪\", \"理\", \"顶\", \"郁\", \"④\", \"里\", \"壕\", \"巅\", \"翡\", \"额\", \"炸\", \"子\", \"a\", \"渺\", \"昌\", \"李\", \"扶\", \"荏\", \"瞠\", \"依\", \"辩\", \"涛\", \"职\", \"枉\", \"驳\", \"斤\", \"溜\", \"凯\", \"圣\", \"钊\", \"』\", \"鹜\", \"腐\", \"坞\", \"棣\", \"茧\", \"捧\", \"发\", \"膝\", \"慮\", \"壑\", \"染\", \"低\", \"狗\", \"辜\", \"搭\", \"寞\", \"情\", \"胎\", \"啦\", \"坏\", \"没\", \"剂\", \"氏\", \"羞\", \"蒿\", \"塑\", \"准\", \"味\", \"签\", \"清\", \"迫\", \"厦\", \"剁\", \"所\", \"售\", \"获\", \"谊\", \"⑴\", \"缔\", \"併\", \"龚\", \"孱\", \"渗\", \"嗔\", \"兽\", \"敏\", \"暧\", \"棺\", \"淹\", \"蹦\", \"继\", \"玄\", \"渥\", \"嫖\", \"散\", \"捍\", \"隔\", \"强\", \"琐\", \"內\", \"冷\", \"岩\", \"液\", \"暄\", \"讪\", \"陷\", \"饥\", \"锈\", \"吝\", \"旋\", \"拎\", \"楷\", \"朋\", \"葬\", \"粪\", \"寨\", \"嫉\", \"愧\", \"绉\", \"焙\", \"狼\", \"唆\", \"鹿\", \"屄\", \"漂\", \"唇\", \"萃\", \"去\", \"隋\", \"秀\", \"奉\", \"娴\", \"阶\", \"恺\", \"玖\", \"专\", \"骇\", \"傅\", \"券\", \"桩\", \"皇\", \"通\", \"莎\", \"殿\", \"驴\", \"河\", \"瀑\", \"恒\", \"炅\", \"歹\", \"奋\", \"肋\", \"旺\", \"焕\", \"蔼\", \"甬\", \"怂\", \"枕\", \"式\", \"躁\", \"尤\", \"温\", \"俄\", \"错\", \"斥\", \"僧\", \"约\", \"淘\", \"萦\", \"咕\", \"鸟\", \"糕\", \"膊\", \"辗\", \"啊\", \"驱\", \"线\", \"膏\", \"驮\", \"袭\", \"站\", \"貌\", \"扰\", \"图\", \"俩\", \"肝\", \"裔\", \"`\", \"熬\", \"庭\", \"芃\", \"薪\", \"灯\", \"迟\", \"兆\", \"疗\", \"府\", \"呵\", \"演\", \"夜\", \"贫\", \"洗\", \"襟\", \"斜\", \"阽\", \"胥\", \"都\", \"栅\", \"ο\", \"濒\", \"當\", \"酒\", \"爷\", \"倘\", \"阳\", \"种\", \"莱\", \"望\", \"江\", \"彻\", \"医\", \"暗\", \"瞅\", \"雾\", \"捷\", \"上\", \"全\", \"附\", \"A\", \"欠\", \"罄\", \"涸\", \"橄\", \"动\", \"狰\", \"骗\", \"仙\", \"唬\", \"敦\", \"勤\", \"簇\", \"呷\", \"缪\", \"部\", \"噬\", \"眩\", \"难\", \"窃\", \"牙\", \"羚\", \"腻\", \"伫\", \"尚\", \"枪\", \"凉\", \"堤\", \"摸\", \"梧\", \"感\", \"您\", \"瞻\", \"宿\", \"溯\", \"衫\", \"或\", \"雀\", \"犷\", \"鲎\", \"存\", \"恙\", \"欧\", \"苣\", \"龙\", \"纬\", \"淆\", \"黢\", \"哦\", \"胚\", \"冉\", \"烤\", \"铜\", \"型\", \"叔\", \"抬\", \"墉\", \"走\", \"剖\", \"方\", \"赡\", \"肖\", \"支\", \"罔\", \"媳\", \"匮\", \"寿\", \"喝\", \"唱\", \"纤\", \"力\", \"晗\", \"踢\", \"直\", \"厨\", \"湃\", \"徇\", \"喜\", \"湘\", \"腓\", \"紊\", \"兹\", \"荒\", \"慷\", \"磕\", \"旦\", \"量\", \"揪\", \"遐\", \"徘\", \"货\", \"撤\", \"礼\", \"侃\", \"ς\", \"厚\", \"怎\", \"脱\", \"(\", \"惹\", \"驿\", \"棍\", \"钞\", \"媛\", \"崩\", \"眼\", \"籁\", \"审\", \"咬\", \"守\", \"跪\", \"〃\", \"汩\", \"张\", \"蜿\", \"ズ\", \"啤\", \"律\", \"弃\", \"悖\", \"狂\", \"贺\", \"咦\", \"伽\", \"互\", \"陡\", \"极\", \"吉\", \"颧\", \"怡\", \"掷\", \"下\", \"糖\", \"捕\", \"熊\", \"卖\", \"瓣\", \"允\", \"住\", \"孕\", \"宛\", \"蓬\", \"穹\", \"罹\", \"眶\", \"誓\", \"尔\", \"強\", \"宙\", \"婶\", \"唯\", \"肴\", \"蕤\", \"罗\", \"艰\", \"蘑\", \"灿\", \"历\", \"靴\", \"攻\", \"嫌\", \"级\", \"时\", \"傍\", \"犟\", \"遣\", \"據\", \"溢\", \"譬\", \"煲\", \"久\", \"啕\", \"旱\", \"土\", \"曹\", \"牒\", \"杨\", \"酵\", \"嘛\", \"浇\", \"画\", \"剑\", \"滴\", \"掖\", \"巧\", \"腋\", \"借\", \"臀\", \"芽\", \"正\", \"婉\", \"戛\", \"袜\", \"岣\", \"饲\", \"芜\", \"父\", \"赫\", \"嗯\", \"莉\", \"醋\", \"高\", \"拜\", \"眉\", \"某\", \"试\", \"o\", \"哈\", \"嘴\", \"粼\", \"醛\", \"巳\", \"選\", \"宰\", \"揭\", \"\\u0000\", \"苒\", \"粘\", \"侠\", \"绑\", \"猎\", \"哥\", \"微\", \"皱\", \"菜\", \"郭\", \"摹\", \"へ\", \"羽\", \"来\", \"掌\", \"杀\", \"十\", \"彪\", \"团\", \"济\", \"房\", \"川\", \"吊\", \"壁\", \"变\", \"邦\", \"衡\", \"艇\", \"V\", \"港\", \"淇\", \"\\u0006\", \"挠\", \"〉\", \"肺\", \"蚓\", \"麽\", \"歌\", \"代\", \"骂\", \"讥\", \"爹\", \"副\", \"名\", \"好\", \"评\", \"夯\", \"伉\", \"呜\", \"耍\", \"厉\", \"品\", \"涅\", \"茁\", \"蜡\", \"肃\", \"灼\", \"熏\", \"砾\", \"辐\", \"辨\", \"沃\", \"绳\", \"飕\", \"绍\", \"彬\", \"保\", \"寡\", \"辛\", \"饼\", \"将\", \"妤\", \"镐\", \".\", \"平\", \"萝\", \"舵\", \"悔\", \"昆\", \"闯\", \"乐\", \"募\", \"国\", \"鲁\", \"萌\", \"星\", \"哺\", \"/\", \"是\", \"裆\", \"矢\", \"邬\", \"纾\", \"逐\", \"晃\", \"迤\", \"弛\", \"伦\", \",\", \"然\", \"摇\", \"妆\", \"炫\", \"滚\", \"祛\", \"贾\", \"呦\", \"葛\", \"近\", \"飘\", \"煜\", \"闸\", \"蝌\", \"晨\", \"姨\", \"贮\", \"嬉\", \"残\", \"病\", \"浊\", \"纱\", \"辅\", \"黏\", \"冯\", \"噢\", \"刁\", \"巾\", \"邕\", \"中\", \"確\", \"捐\", \"惠\", \"孙\", \"闾\", \"波\", \"霖\", \"跨\", \"民\", \"立\", \"冽\", \"每\", \"汉\", \"齿\", \"犯\", \"神\", \"酬\", \"边\", \"雕\", \"嵌\", \"朽\", \"练\", \"撬\", \"聋\", \"贤\", \"娶\", \"枷\", \"仕\", \"茜\", \"被\", \"南\", \"忠\", \"嘟\", \"任\", \"棋\", \"样\", \"泳\", \"电\", \"窗\", \"有\", \"歩\", \"胸\", \"骼\", \"睦\", \"疯\", \"狸\", \"刺\", \"~\", \"诶\", \"姗\", \"覆\", \"原\", \"轼\", \"憬\", \"缜\", \"点\", \"苇\", \"血\", \"惫\", \"抚\", \"教\", \"宴\", \"现\", \"陇\", \"姆\", \"肚\", \"+\", \"汹\", \"扁\", \"耽\", \"翌\", \"褂\", \"巡\", \"稽\", \"纳\", \"?\", \"⑸\", \"壹\", \"娠\", \"岚\", \"咚\", \"溅\", \"吩\", \"瓜\", \"耀\", \"尊\", \"渣\", \"鲍\", \"钩\", \"電\", \"缄\", \"骑\", \"噼\", \"快\", \"撑\", \"孝\", \"雅\", \"官\", \"骸\", \"蹭\", \"铝\", \"―\", \"世\", \"邵\", \"镍\", \"桦\", \"注\", \"火\", \"行\", \"哪\", \"石\", \"俘\", \"蜃\", \"绅\", \"甩\", \"慌\", \"柿\", \"督\", \"颈\", \"砍\", \"吗\", \"燃\", \"杆\", \"公\", \"概\", \"绝\", \"吱\", \"校\", \"乱\", \"惋\", \"本\", \"哼\", \"征\", \"↑\", \"赐\", \"柬\", \"师\", \"靶\", \"刻\", \"驰\", \"塞\", \"为\", \"锐\", \"轰\", \"恍\", \"勘\", \"踌\", \"扑\", \"浅\", \"锲\", \"寓\", \"急\", \"若\", \"嗜\", \"突\", \"甲\", \"已\", \"媲\", \"粉\", \"死\", \"睹\", \"②\", \"瓷\", \"衅\", \"呛\", \"待\", \"痘\", \"喇\", \"浴\", \"辣\", \"赁\", \"夏\", \"t\", \"烙\", \"ě\", \"卡\", \"女\", \"凤\", \"擎\", \"尉\", \"还\", \"丈\", \"鼾\", \"席\", \"秘\", \"纪\", \"鱼\", \"俊\", \"篱\", \"檬\", \"计\", \"瘫\", \"磁\", \"祀\", \"设\", \"涌\", \"界\", \"卫\", \"ノ\", \"畔\", \"升\", \"\", \"〈\", \"涕\", \"渔\", \"癜\", \"畸\", \"颗\", \"仲\", \"责\", \"瑕\", \"盒\", \"柜\", \"疸\", \"锻\", \"勾\", \"撇\", \"妊\", \"秦\", \"细\", \"胜\", \"决\", \"挪\", \"仇\", \"隘\", \"斯\", \"抨\", \"搐\", \"鞘\", \"抡\", \"摞\", \"统\", \"攥\", \"殆\", \"带\", \"晟\", \"镏\", \"玩\", \"定\", \"荡\", \"锄\", \"记\", \"メ\", \"巩\", \"婷\", \"春\", \"汕\", \"纯\", \"怠\", \"d\", \"砧\", \"钰\", \"用\", \"祟\", \"徒\", \"砥\", \"疮\", \"履\", \"锤\", \"滓\", \"韫\", \"穰\", \"咙\", \"窟\", \"猜\", \"尹\", \"议\", \"邃\", \"勖\", \"踵\", \"邋\", \"脐\", \"葡\", \"阎\", \"瑰\", \"象\", \"掩\", \"蛛\", \"璨\", \"断\", \"慰\", \"兵\", \"髻\", \"荷\", \"均\", \"碰\", \"咖\", \"利\", \"妹\", \"惩\", \"曦\", \"育\", \"缸\", \"培\", \"叹\", \"墨\", \"猛\", \"旎\", \"谬\", \"纰\", \"测\", \"治\", \"免\", \"凸\", \"扇\", \"猴\", \"幼\", \"俨\", \"究\", \"移\", \"沿\", \"墙\", \"软\", \"小\", \"采\", \"奴\", \"←\", \"嗡\", \"昵\", \"桂\", \"》\", \"漉\", \"虱\", \"组\", \"跋\", \"抄\", \"厥\", \"孤\", \"萍\", \"恩\", \"惺\", \"渎\", \"藏\", \"衷\", \"叭\", \"锌\", \"\\u0007\", \"阪\", \"煞\", \"瑶\", \"乙\", \"聆\", \"馆\", \"⑩\", \"只\", \"\\b\", \"璀\", \"曰\", \"戢\", \"槌\", \"恿\", \"豹\", \"逸\", \"蒜\", \"众\", \"餐\", \"钥\", \"左\", \"倩\", \"煽\", \"灌\", \"蛇\", \"馕\", \"可\", \"伤\", \"p\", \"秽\", \"晦\", \"泻\", \"奎\", \"魄\", \"深\", \"镉\", \"∶\", \"撞\", \"锡\", \"淼\", \"登\", \"播\", \"槛\", \"虑\", \"晖\", \"霓\", \"拙\", \"澡\", \"色\", \"扣\", \"爽\", \"楠\", \"狠\", \"葩\", \"桅\", \"黄\", \"龟\", \"掉\", \"幽\", \"滨\", \"综\", \"馍\", \"瘤\", \"ὐ\", \"脏\", \"徨\", \"内\", \"胫\", \"示\", \"人\", \"泡\", \";\", \"朱\", \"〞\", \"烯\", \"徳\", \"椭\", \"伯\", \"羊\", \"滑\", \"乍\", \"犁\", \"伏\", \"棠\", \"戮\", \"昕\", \"刷\", \"黎\", \"逗\", \"畴\", \"怜\", \"翩\", \"滋\", \"霾\", \"菩\", \"吐\", \"臊\", \"氮\", \"性\", \"员\", \"悠\", \"跚\", \"漏\", \"谜\", \"喔\", \"矛\", \"砸\", \"胆\", \"舍\", \"谈\", \"对\", \"弑\", \"太\", \"刨\", \"邮\", \"徙\", \"攫\", \"榻\", \"寸\", \"搞\", \"埋\", \"寝\", \"盹\", \"斛\", \"机\", \"爬\", \"掏\", \"临\", \"翕\", \"延\", \"宸\", \"玉\", \"■\", \"菇\", \"习\", \"框\", \"筐\", \"琦\", \"厅\", \"吞\", \"镀\", \"的\", \"彼\", \"飙\", \"磋\", \"共\", \"悄\", \"华\", \"敲\", \"踪\", \"吏\", \"相\", \"窘\", \"凹\", \"账\", \"缝\", \"遁\", \"嚣\", \"撅\", \"⑦\", \"棘\", \"握\", \"应\", \"吻\", \"顽\", \"暑\", \"甚\", \"瑄\", \"萎\", \"简\", \"储\", \"期\", \"舞\", \"怨\", \"·\", \"藉\", \"珉\", \"⑧\", \"锢\", \"辄\", \"屿\", \"括\", \"随\", \"赣\", \"蛋\", \"祭\", \"株\", \"愁\", \"豚\", \"竭\", \"掬\", \"奸\", \"梅\", \"趁\", \"個\", \"那\", \"垫\", \"逢\", \"失\", \"郝\", \"买\", \"慢\", \"银\", \"臼\", \"搬\", \"乓\", \"匪\", \"坟\", \"迷\", \"鸦\", \"意\", \"限\", \"门\", \"宇\", \"仰\", \"鲨\", \"佛\", \"陵\", \"篢\", \"岔\", \"殷\", \"嘻\", \"烁\", \"岂\", \"兄\", \"悼\", \"新\", \"擦\", \"垢\", \"簧\", \"误\", \"收\", \"矮\", \"削\", \"英\", \"媚\", \"拌\", \"过\", \"戳\", \"厮\", \"闭\", \"卧\", \"西\", \"峙\", \"街\", \"鞭\", \"垠\", \"霞\", \"尺\", \"讯\", \"袋\", \"夥\", \"遏\", \"吁\", \"薰\", \"娥\", \"讳\", \"牡\", \"野\", \"兼\", \"鸿\", \"跷\", \"咆\", \"鸡\", \"贱\", \"僻\", \"坤\", \"矶\", \"損\", \"非\", \"产\", \"唉\", \"荟\", \"号\", \"完\", \"2\", \"凋\", \"能\", \"弹\", \"慈\", \"积\", \"隐\", \"脆\", \"⑤\", \"鳌\", \"盎\", \"\", \"◆\", \"冥\", \"猖\", \"吃\", \"瞪\", \"伊\", \"届\", \"剔\", \"叮\", \"瓶\", \"汽\", \"嘱\", \"瘙\", \"混\", \"听\", \"啪\", \"绊\", \"垮\", \"倡\", \"俚\", \"磊\", \"笑\", \"惰\", \"蜴\", \"笨\", \"宫\", \"粟\", \"肘\", \"痴\", \"箔\", \"骆\", \"腹\", \"山\", \"倍\", \"鸥\", \"恐\", \"监\", \"践\", \"榨\", \"阮\", \"疚\", \"顾\", \"铁\", \"晋\", \"乖\", \"荆\", \"庚\", \"抠\", \"撐\", \"芦\", \"超\", \"宾\", \"虔\", \"晾\", \"網\", \"渠\", \"欲\", \"虽\", \"悉\", \"乘\", \"伍\", \"鹃\", \"寄\", \"忱\", \"喊\", \"铣\", \"熨\", \"逑\", \"飓\", \"葱\", \"功\", \"\", \"辟\", \"喆\", \"益\", \"朵\", \"踊\", \"坪\", \"文\", \"持\", \"缘\", \"伙\", \"岖\", \"螺\", \"纹\", \"句\", \"劈\", \"比\", \"茎\", \"氰\", \"挺\", \"敬\", \"京\", \"赖\", \"疫\", \"但\", \"声\", \"骰\", \"屁\", \"城\", \"两\", \"\\\\\", \"篓\", \"蓝\", \"盐\", \"揣\", \"蕃\", \"据\", \"價\", \"接\", \"彷\", \"鳞\", \"竖\", \"扎\", \"竞\", \"减\", \"颐\", \"陨\", \"价\", \"见\", \"巫\", \"恋\", \"饷\", \"邱\", \"荫\", \"烘\", \"诃\", \"幸\", \"暖\", \"滇\", \"邻\", \"译\", \"洒\", \"瓦\", \"罢\", \"影\", \"咱\", \"槽\", \"夕\", \"社\", \"憔\", \"喻\", \"侥\", \"叩\", \"赴\", \"庞\", \"咧\", \"雷\", \"嚎\", \"璧\", \"蚊\", \"垒\", \"成\", \"粱\", \"召\", \"厄\", \"谴\", \"杠\", \"读\", \"淋\", \"郎\", \"抱\", \"称\", \"族\", \"田\", \"贞\", \"陀\", \"昭\", \"客\", \"君\", \"虚\", \"候\", \"贼\", \"绽\", \"拂\", \"庐\", \"裴\", \"祉\", \"炕\", \"蝶\", \"泄\", \"圭\", \"茉\", \"厢\", \"泽\", \"雨\", \"刹\", \"占\", \"册\", \"遴\", \"拓\", \"扛\", \"暹\", \"咨\", \"炭\", \"莴\", \"褐\", \"酱\", \"饵\", \"按\", \"吟\", \"密\", \"徽\", \"友\", \"粒\", \"俞\", \"岌\", \"瑢\", \"辑\", \"二\", \"婊\", \"襄\", \"域\", \"格\", \"恢\", \"婴\", \"泪\", \"范\", \"村\", \"脯\", \"脖\", \"留\", \"写\", \"洪\", \"汝\", \"涮\", \"闫\", \"泌\", \"嫂\", \"程\", \"愉\", \"胀\", \"刚\", \"托\", \"宝\", \"冀\", \"巍\", \"潦\", \"默\", \"薩\", \"己\", \"玫\", \"粕\", \"傲\", \"根\", \"馈\", \"侵\", \"笋\", \"鄙\", \"愿\", \")\", \"丽\", \"浦\", \"迪\", \"耸\", \"伐\", \"}\", \"救\", \"筋\", \"倾\", \"搡\", \"绪\", \"忧\", \"政\", \"稿\", \"蹄\", \"桑\", \"3\", \"苦\", \"倒\", \"腊\", \"℃\", \"士\", \"锥\", \"捂\", \"项\", \"恼\", \"反\", \"详\", \"赌\", \"撰\", \"丛\", \"邸\", \"囊\", \"吼\", \"乒\", \"诣\", \"橙\", \"莘\", \"瘾\", \"农\", \"康\", \"辱\", \"闪\", \"卻\", \"灰\", \"博\", \"鄂\", \"些\", \"哭\", \"疹\", \"栖\", \"维\", \"纠\", \"晶\", \"聿\", \"咐\", \"筛\", \"推\", \"芒\", \"填\", \"橘\", \"迦\", \"馄\", \"携\", \"植\", \"鹦\", \"轿\", \"柚\", \"截\", \"佰\", \"鸣\", \"捉\", \"七\", \"报\", \"竿\", \"俪\", \"○\", \"建\", \"景\", \"离\", \"脑\", \"虫\", \"佳\", \"滥\", \"悦\", \"咀\", \"虹\", \"炉\", \"澎\", \"盏\", \"浏\", \"抑\", \"硬\", \"侍\", \"探\", \"崽\", \"多\", \"恣\", \"震\", \"债\", \"挤\", \"芙\", \"燥\", \"s\", \"篷\", \"苛\", \"帽\", \"跳\", \"尝\", \"辽\", \"诸\", \"曝\", \"吠\", \"8\", \"划\", \"院\", \"片\", \"操\", \"激\", \"柯\", \"柴\", \"蚪\", \"報\", \"毎\", \"娑\", \"合\", \"蹴\", \"偏\", \"罚\", \"袁\", \"楂\", \"冶\", \"年\", \"物\", \"特\", \"瀚\", \"枢\", \"玷\", \"煎\", \"丝\", \"祈\", \"岸\", \"匕\", \"漓\", \"课\", \"映\", \"裳\", \"茵\", \"玛\", \"墅\", \"唷\", \"信\", \"鼻\", \"库\", \"户\", \"穗\", \"贩\", \"呀\", \"潭\", \"拖\", \"材\", \"淄\", \"违\", \"哲\", \"藕\", \"悟\", \"踩\", \"区\", \"懒\", \"惟\", \"绿\", \"埃\", \"唾\", \"德\", \"金\", \"窜\", \"韪\", \"扼\", \"耳\", \"做\", \"袱\", \"惑\", \"屠\", \"谭\", \"檐\", \"池\", \"潜\", \"漩\", \"喧\", \"憾\", \"和\", \"充\", \"拭\", \"智\", \"袖\", \"蟋\", \"栈\", \"损\", \"赘\", \"厘\", \"牠\", \"融\", \"夹\", \"辆\", \"砂\", \"莺\", \"膀\", \"诺\", \"浙\", \"桔\", \"逞\", \"、\", \"钵\", \"钓\", \"桐\", \"奏\", \"荨\", \"俯\", \"茸\", \"懈\", \"却\", \"卿\", \"丐\", \"歼\", \"妙\", \"视\", \"妃\", \"巨\", \"题\", \"兮\", \"禧\", \"侣\", \"秸\", \"订\", \"桶\", \"缈\", \"虞\", \"9\", \"鼎\", \"巷\", \"屣\", \"抖\", \"酿\", \"呼\", \"传\", \"营\", \"咪\", \"拆\", \"规\", \"蝗\", \"踏\", \"店\", \"触\", \"⒌\", \"而\", \"懵\", \"饱\", \"层\", \"膳\", \"札\", \"谱\", \"伴\", \"扫\", \"挖\", \"孀\", \"挝\", \"照\", \"晴\", \"礁\", \"尴\", \"腱\", \"淖\", \"胰\", \"蓁\", \"噪\", \"歧\", \"疏\", \"浞\", \"侈\", \"偶\", \"果\", \"再\", \"振\", \"适\", \"糟\", \"妥\", \"市\", \"濮\", \"烫\", \"酪\", \"锂\", \"摒\", \"拨\", \"刊\", \"阁\", \"帝\", \"盲\", \"臂\", \"猫\", \"薇\", \"乞\", \"喂\", \"颖\", \"背\", \"霏\", \"芳\", \"恶\", \"戚\", \"负\", \"估\", \"瞧\", \"抒\", \"烧\", \"活\", \"肮\", \"吾\", \"扬\", \"竣\", \"蟑\", \"丹\", \"後\", \"凛\", \"涣\", \"策\", \"臆\", \"杯\", \"捡\", \"妓\", \"罪\", \"躇\", \"钻\", \"牖\", \"描\", \"渐\", \"驻\", \"傻\", \"扮\", \"翱\", \"讶\", \"敖\", \"伟\", \"帆\", \"佬\", \"诞\", \"个\", \"碎\", \"琛\", \"慧\", \"寻\", \"阑\", \"调\", \"珊\", \"惕\", \"竟\", \"倚\", \"亲\", \"需\", \"打\", \"拼\", \"苗\", \"湾\", \"童\", \"阅\", \"隶\", \"熔\", \"氢\", \"郸\", \"塌\", \"像\", \"秋\", \"蛙\", \"料\", \"卓\", \"裹\", \"字\", \"徐\", \"涉\", \"毯\", \"署\", \"堕\", \"芥\", \"胱\", \"诧\", \"犰\", \"葵\", \"诫\", \"肛\", \"瑧\", \"沓\", \"抓\", \"扭\", \"⒁\", \"游\", \"锒\", \"圜\", \"困\", \"颁\", \"委\", \"徊\", \"蜕\", \"吓\", \"姻\", \"搜\", \"宗\", \"敝\", \"远\", \"捺\", \"欺\", \"芹\", \"侨\", \"暮\", \"前\", \"算\", \"柠\", \"半\", \"為\", \"窍\", \"局\", \"欣\", \"蛊\", \"慨\", \"沟\", \"馒\", \"畿\", \"皆\", \"销\", \"兰\", \"迎\", \"©\", \"澈\", \"逍\", \"拥\", \"商\", \"如\", \"法\", \"呗\", \"彩\", \"省\", \"烈\", \"灶\", \"祸\", \"別\", \"\", \"怯\", \"勋\", \"肩\", \"匈\", \"楼\", \"替\", \"惦\", \"网\", \"篇\", \"开\", \"出\", \"击\", \"稍\", \"琢\", \"凄\", \"黔\", \"皖\", \"场\", \"僵\", \"辞\", \"武\", \"宪\", \"午\", \"黯\", \"馅\", \"抿\", \"烃\", \"腕\", \"三\", \"悍\", \"曼\", \"撒\", \"\\u0005\", \"瞥\", \"醒\", \"洲\", \"黝\", \"湮\", \"倦\", \"⒋\", \"双\", \"叉\", \"广\", \"指\", \"贷\", \"戴\", \"楣\", \"拧\", \"赢\", \"蜒\", \"擂\", \"霸\", \"乾\", \"昨\", \"撸\", \"迁\", \"列\", \"砖\", \"覃\", \"树\", \"析\", \"受\", \"嗣\", \"聪\", \"悴\", \"镑\", \"亟\", \"拾\", \"瑞\", \"翅\", \"尘\", \"岳\", \"麟\", \"瞩\", \"炒\", \"斧\", \"催\", \"霊\", \"涤\", \"选\", \"俭\", \"蓉\", \"苟\", \"率\", \"滢\", \"配\", \"巢\", \"淮\", \"第\", \"叶\", \"⑿\", \"炝\", \"彭\", \"窥\", \"畑\", \"射\", \"哉\", \"娅\", \"趟\", \"掀\", \"矍\", \"翁\", \"敷\", \"蔡\", \"耩\", \"時\", \"怪\", \"涯\", \"婿\", \"虐\", \"郊\", \"览\", \"别\", \"踱\", \"踞\", \"─\", \"茶\", \"承\", \"跃\", \"斐\", \"毙\", \"恳\", \"予\", \"雳\", \"凝\", \"弩\", \"健\", \"故\", \"业\", \"耶\", \"妮\", \"颓\", \"毕\", \"粹\", \"赚\", \"袍\", \"僚\", \"魏\", \"仔\", \"趴\", \"垂\", \"玳\", \"讦\", \"励\", \"翻\", \"套\", \"啡\", \"翰\", \"娟\", \"必\", \"敌\", \"猥\", \"炊\", \"\", \"攸\", \"针\", \"研\", \"显\", \"嫁\", \"云\", \"少\", \"输\", \"氨\", \"铸\", \"扳\", \"遇\", \"了\", \"拽\", \"焯\", \"狭\", \"孵\", \"羁\", \"噴\", \"坑\", \"ㄓ\", \"婪\", \"稣\", \"伺\", \"妒\", \"仑\", \"奘\", \"凶\", \"赏\", \"腥\", \"枣\", \"该\", \"滞\", \"速\", \"陛\", \"e\", \"判\", \"哗\", \"憨\", \"祢\", \"钢\", \"擤\", \"劑\", \"陪\", \"孽\", \"埔\", \"勺\", \"投\", \"坠\", \"淫\", \"俏\", \"臭\", \"棕\", \"夭\", \"乌\", \"丢\", \"鼓\", \"财\", \"瑜\", \"胧\", \"曙\", \"葫\", \"闻\", \"颜\", \"番\", \"迅\", \"缩\", \"抛\", \"聘\", \"谀\", \"骏\", \"漲\", \"爪\", \"五\", \"怀\", \"面\", \"租\", \"授\", \"猬\", \"躲\", \"湛\", \"造\", \"距\", \"肯\", \"偷\", \"辉\", \"兴\", \"灸\", \"脸\", \"峻\", \"梭\", \"铤\", \"碱\", \"卵\", \"狞\", \"绷\", \"赠\", \"悚\", \"制\", \"缆\", \"蹈\", \"炙\", \"屋\", \"崇\", \"冬\", \"气\", \"颉\", \"吕\", \"帮\", \"盘\", \"亨\", \"币\", \"况\", \"蹩\", \"桃\", \"郴\", \"壮\", \"陕\", \"邯\", \"甜\", \"着\", \"莫\", \"躺\", \"冰\", \"钦\", \"遑\", \"黛\", \"汪\", \"施\", \"聊\", \"寰\", \"八\", \"奔\", \"铨\", \"耐\", \"缓\", \"段\", \"堵\", \"贡\", \"认\", \"禁\", \"筝\", \"梗\", \"懦\", \"狄\", \"螃\", \"棱\", \"备\", \"慑\", \"栩\", \"命\", \"箭\", \"争\", \"纲\", \"芋\", \"亵\", \"从\", \"谢\", \"姓\", \"择\", \"海\", \"辕\", \"雄\", \"沦\", \"荧\", \"努\", \"晚\", \"月\", \"集\", \"观\", \"琳\", \"碳\", \"漫\", \"鸽\", \"涩\", \"围\", \"例\", \"论\", \"知\", \"毋\", \"氯\", \"够\", \"累\", \"泱\", \"摩\", \"陌\", \"肢\", \"邀\", \"渝\", \"★\", \"谨\", \"姊\", \"峰\", \"湄\", \"退\", \"阀\", \"蓦\", \"佘\", \"忡\", \"炖\", \"迩\", \"涡\", \"寐\", \"胞\", \"及\", \"扯\", \"饿\", \"润\", \"惊\", \"赤\", \"生\", \"辰\", \"詹\", \"峭\", \"滔\", \"瞳\", \"碑\", \"球\", \"王\", \"摘\", \"禄\", \"础\", \"伪\", \"羹\", \"壳\", \"皙\", \"诲\", \"频\", \"坚\", \"叼\", \"碧\", \"茏\", \""\", \"渊\", \"蓟\", \"痹\", \"瞎\", \"疙\", \"嗓\", \"镳\", \"船\", \"孔\", \"弗\", \"固\", \"帖\", \"噱\", \"越\", \"仁\", \"円\", \"_\", \"弄\", \"奢\", \"抉\", \"重\", \"疑\", \"愕\", \"之\", \"嘲\", \"披\", \"基\", \"辖\", \"牲\", \"到\", \"碟\", \"心\", \"忐\", \"4\", \"壤\", \"园\", \"斗\", \"シ\", \"贬\", \"勿\", \"嗪\", \"织\", \"柄\", \"娜\", \"恨\", \"帜\", \"烹\", \"目\", \"婆\", \"肓\", \"糯\", \"亮\", \"崛\", \"蛮\", \"核\", \"遂\", \"忽\", \"霭\", \"俺\", \"勃\", \"酥\", \"n\", \"趣\", \"牵\", \"地\", \"醇\", \"碗\", \"梁\", \"霄\", \"惘\", \"亳\", \"涨\", \"邂\", \"牺\", \"瀛\", \"沉\", \"满\", \"撷\", \"※\", \"铂\", \"苹\", \"契\", \"胺\", \"洛\", \"录\", \"憋\", \"噩\", \"剥\", \"莓\", \"薛\", \"骛\", \"逆\", \"诙\", \"妍\", \"拉\", \"缕\", \"森\", \"赛\", \"屏\", \"谅\", \"麻\", \"舒\", \"炎\", \"冤\", \"茄\", \"类\", \"攒\", \"缀\", \"尧\", \"哄\", \"淑\", \"洽\", \"睿\", \"口\", \"荼\", \"亂\", \"顿\", \"宣\", \"米\", \"删\", \"壶\", \"属\", \"朴\", \"③\", \"冲\", \"庸\", \"榜\", \"链\", \"堆\", \"今\", \"【\", \"态\", \"权\", \"匿\", \"铛\", \"挥\", \"阿\", \"姐\", \"▲\", \"饰\", \"鳃\", \"邓\", \"钮\", \"梨\", \"挲\", \"萼\", \"嘀\", \"萧\", \"此\", \"黑\", \"旆\", \"林\", \"姿\", \"敞\", \"槃\", \"谷\", \"供\", \"剩\", \"栏\", \"学\", \"扉\", \"磅\", \"廷\", \"锁\", \"疤\", \"眨\", \"鑫\", \"瑨\", \"键\", \"毛\", \"颌\", \"终\", \"四\", \"净\", \"イ\", \"缥\", \"權\", \"〔\", \"谎\", \"绞\", \"筹\", \"⒀\", \"採\", \"榷\", \"旁\", \"芝\", \"殊\", \"郜\", \"泵\", \"诚\", \"呃\", \"遍\", \"儒\", \"褒\", \"靖\", \"亥\", \"碍\", \"醍\", \"颠\", \"泰\", \"摆\", \"焉\", \"捞\", \"搅\", \"缚\", \"邑\", \"喽\", \"奂\", \"谣\", \"屑\", \"膛\", \"矫\", \"真\", \"镇\", \"药\", \"蔑\", \"碴\", \"舎\", \"裁\", \"拯\", \"往\", \"氛\", \"茅\", \"妇\", \"具\", \"咋\", \"吆\", \"姬\", \"沛\", \"拷\", \"导\", \"浑\", \"艳\", \"麾\", \"\", \"魔\", \"寂\", \"凌\", \"至\", \"横\", \"孰\", \"昧\", \"硅\", \"橡\", \"值\", \"毗\", \"捅\", \"炬\", \"淳\", \"岐\", \"役\", \"肉\", \"殴\", \"秤\", \"条\", \"老\", \"岁\", \"夷\", \"台\", \"后\", \"架\", \"煌\", \"哇\", \"樯\", \"觉\", \"竹\", \"扩\", \"仍\", \"椅\", \"珀\", \"隧\", \"賣\", \"悬\", \"薯\", \"诅\", \"嘣\", \"&\", \"叠\", \"劫\", \"峨\", \"喱\", \"花\", \"咽\", \"轻\", \"烬\", \"邹\", \"⒃\", \"幢\", \"蚌\", \"央\", \"痪\", \"淌\", \"挣\", \"笛\", \"拒\", \"且\", \"搁\", \"诨\", \"滤\", \"愚\", \"旬\", \"敢\", \"谑\", \"答\", \"码\", \"止\", \"坡\", \"篡\", \"证\", \"什\", \"姚\", \"谍\", \"辫\", \"搀\", \"骚\", \"未\", \"柔\", \"畜\", \"瘩\", \"他\", \"楔\", \"劣\", \"请\", \"胡\", \"页\", \"嗦\", \"茂\", \"票\", \"求\", \"勇\", \"陆\", \"渴\", \"C\", \"余\", \"慕\", \"冈\", \"洋\", \"骄\", \"^\", \"庇\", \"棂\", \"ソ\", \"柘\", \"〝\", \"懑\", \"返\", \"刀\", \"畅\", \"兜\", \"哀\", \"剪\", \"工\", \"桢\", \"埠\", \"亭\", \"荤\", \"汶\", \"惶\", \"肤\", \"瘀\", \"自\", \"竺\", \"腔\", \"牢\", \"D\", \"执\", \"独\", \"燎\", \"枚\", \"扔\", \"酌\", \"谧\", \"欢\", \"摔\", \"戏\", \"衬\", \"弘\", \"耦\", \"卤\", \"の\", \"蜜\", \"词\", \"偻\", \"严\", \"蹿\", \"递\", \"酝\", \"笆\", \"蓄\", \"亡\", \"稀\", \"批\", \"煤\", \"遵\", \"脂\", \"冠\", \"泼\", \"衔\", \"匠\", \"並\", \"琅\", \"径\", \"屌\", \"咳\", \"怔\", \"梦\", \"鳗\", \"姑\", \"奠\", \"峡\", \"窦\", \"酸\", \"甯\", \"琉\", \"贪\", \"舅\", \"确\", \"更\", \"股\", \"汤\", \"伞\", \"拇\", \"因\", \"惭\", \"械\", \"崔\", \"猡\", \"脉\", \"分\", \"擘\", \"牧\", \"秆\", \"肇\", \"风\", \"即\", \"警\", \"降\", \"惧\", \"耗\", \"疼\", \"躯\", \"珏\", \"麦\", \"跻\", \"坂\", \"败\", \"汐\", \"眺\", \"[\", \"杰\", \"珠\", \"颂\", \"水\", \"哎\", \"腺\", \"逊\", \"烛\", \"鞠\", \"屎\", \"克\", \"苍\", \"胳\", \"稻\", \"以\", \":\", \"加\", \"谁\", \"拗\", \"裙\", \"叫\", \"志\", \"诩\", \"服\", \"协\", \"找\", \"乳\", \"昔\", \"愣\", \"喘\", \"厌\", \"娇\", \"措\", \"这\", \"弱\", \"碾\", \"县\", \"韩\", \"锏\", \"沁\", \"苑\", \"迈\", \"送\", \"矗\", \"暨\", \"识\", \"眠\", \"圩\", \"顺\", \"思\", \"瓢\", \"鞍\", \"铄\", \"袒\", \"档\", \"援\", \"奚\", \"仅\", \"犄\", \"胖\", \"卜\", \"阴\", \"钧\", \"⒂\", \"屹\", \"赃\", \"结\", \"不\", \"聒\", \"鞋\", \"军\", \"挡\", \"纵\", \"虾\", \"大\", \"访\", \"蔓\", \"韧\", \"嗤\", \"谓\", \"洼\", \"才\", \"黩\", \"啸\", \"毒\", \"遥\", \"凿\", \"豆\", \"转\", \"塘\", \"菁\", \"舌\", \"噌\", \"愤\", \"浓\", \"闵\", \"玮\", \"匀\", \"壓\", \"芮\", \"π\", \"很\", \"脊\", \"玻\", \"。\", \"澄\", \"豌\", \"釜\", \"娃\", \"痛\", \"浚\", \"杖\", \"朔\", \"案\", \"间\", \"尼\", \"谦\", \"六\", \"N\", \"怒\", \"迭\", \"恰\", \"殖\", \"庙\", \"企\", \"牛\", \"涟\", \"璜\", \"窄\", \"捆\", \"員\", \"装\", \"补\", \"阜\", \"位\", \"枯\", \"岭\", \"吸\", \"盾\", \"腿\", \"敛\", \"居\", \"楚\", \"醉\", \"郡\", \"撼\", \"绚\", \"安\", \"咏\", \"鲤\", \"椎\", \"须\", \"史\", \"褪\", \"慎\", \"漆\", \"防\", \"丧\", \"戈\", \"杉\", \"旅\", \"泉\", \"茫\", \"珞\", \"豫\", \"静\", \"侬\", \"●\", \"圆\", \"琼\", \"炳\", \"空\", \"祥\", \"汲\", \"身\", \"创\", \"宵\", \"爻\", \"灭\", \"蜷\", \"忌\", \"香\", \"复\", \"棵\", \"蕉\", \"霜\", \"琶\", \"沫\", \"缉\", \"抽\", \"揉\", \"言\", \"唤\", \"坎\", \"割\", \"饨\", \"奇\", \"患\", \"靓\", \"作\", \"箱\", \"招\", \"痕\", \"罩\", \"鸭\", \"龇\", \"芷\", \"纺\", \"骅\", \"途\", \"沏\", \"享\", \"×\", \"沙\", \"彤\", \"瞄\", \"i\", \"甫\", \"油\", \"溪\", \"鹈\", \"屉\", \"吭\", \"也\", \"劳\", \"窝\", \"搏\", \"抢\", \"垄\", \"泥\", \"当\", \"堂\", \"梳\", \"雍\", \"啬\", \"爵\", \"溶\", \"晓\", \"摊\", \"箍\", \"嗨\", \"诈\", \"秩\", \"裘\", \"腭\", \"诵\", \"戍\", \"最\", \"龄\", \"鬼\", \"盗\", \"籍\", \"睬\", \"锚\", \"骨\", \"巴\", \"鲸\", \"廖\", \"拐\", \"饽\", \"关\", \"跟\", \"泊\", \"蚯\", \"烦\", \"亩\", \"训\", \"著\", \"蠢\", \"簿\", \"我\", \"陶\", \"秉\", \"杂\", \"绎\", \"蕾\", \"佐\", \"蜥\", \"单\", \"菊\", \"坷\", \"疵\", \"乔\", \"诟\", \"」\", \"涵\", \"硫\", \"鲜\", \"羔\", \"睐\", \"0\", \"藤\", \"焊\", \"啐\", \"睑\", \"白\", \"圈\", \"醐\", \"驭\", \"嘭\", \"赂\", \"莞\", \"旧\", \"剽\", \"砌\", \"粤\", \"宽\", \"菲\", \"章\", \"泠\", \"哧\", \"彗\", \"粽\", \"验\", \"穴\", \"憧\", \"矿\", \"朗\", \"落\", \"玲\", \"資\", \"苯\", \"铭\", \"〖\", \"鼠\", \"流\", \"足\", \"符\", \"狱\", \"睁\", \"夺\", \"狡\", \"矣\", \"爱\", \"晒\", \"焚\", \"烂\", \"皑\", \"则\", \"佼\", \"险\", \"祷\", \"r\", \"令\", \"\", \"燕\", \"厝\", \"各\", \"数\", \"奶\", \"似\", \"循\", \"贝\", \"话\", \"鼯\", \"封\", \"晰\", \"秃\", \"⑶\", \"桌\", \"包\", \"御\", \"贴\", \"布\", \"7\", \"坦\", \"潇\", \"狮\", \"座\", \"蚤\", \"绥\", \"愈\", \"遢\", \"费\", \"事\", \"破\", \"{\", \"宁\", \"挑\", \"鹰\", \"犹\", \"叙\", \"零\", \"嘎\", \"墟\", \"渍\", \"联\", \"载\", \"�\", \"栓\", \"绸\", \"讼\", \"暴\", \"潘\", \"挨\", \"并\", \"墓\", \"臻\", \"何\", \"幅\", \"废\", \"申\", \"榄\", \"沥\", \"耿\", \"椰\", \"夫\", \"笔\", \"柱\", \"侧\", \"顷\", \"佟\", \"首\", \"栋\", \"棚\", \"孜\", \"消\", \"魅\", \"艺\", \"褚\", \"势\", \"谩\", \"寥\", \"熄\", \"匾\", \"诬\", \"季\", \"启\", \"达\", \"弊\", \"讲\", \"系\", \"良\", \"蜘\", \"馏\", \"另\", \"绕\", \"缠\", \"呸\", \"姣\", \"\", \"恤\", \"仗\", \"室\", \"髓\", \"嚼\", \"整\", \"化\", \"鹕\", \"偎\", \"忙\", \"・\", \"佣\", \"虎\", \"剧\", \"呆\", \"擞\", \"哒\", \"鸩\", \"淡\", \"歉\", \"寒\", \"跌\", \"丘\", \"诡\", \"领\", \"禾\", \"兑\", \"诊\", \"度\", \"伸\", \"奖\", \"镭\", \"喀\", \"埂\", \"腰\", \"筑\", \"涎\", \"⑥\", \"际\", \"助\", \"飚\", \"渡\", \"掂\", \"匙\", \"镶\", \"凳\", \"曾\", \"於\", \"磺\", \"罕\", \"角\", \"舟\", \"疲\", \"嵘\", \"青\", \"鹭\", \"先\", \"屡\", \"办\", \"癌\", \"韵\", \"天\", \"铲\", \"给\", \"尬\", \"赅\", \"睛\", \"问\", \"逶\", \"沮\", \"增\", \"惴\", \"阱\", \"铩\", \"次\", \"帕\", \"陈\", \"彰\", \"璎\", \"献\", \"拦\", \"典\", \"卷\", \"松\", \"一\", \"镜\", \"妻\", \"奈\", \"道\", \"翠\", \"肠\", \"①\", \"沽\", \" \", \"挈\", \"囚\", \"早\", \"】\", \"翊\", \"遭\", \"容\", \"诀\", \"璃\", \"危\", \"讽\", \"α\", \"堪\", \"赵\", \"卢\", \"裸\", \" \", \"精\", \"庆\", \"家\", \"沈\", \"藐\", \"块\", \"恭\", \"纸\", \"禽\", \"毫\", \"锋\", \"皂\", \"笼\", \"逅\", \"贵\", \"瞰\", \"奥\", \"焦\", \"璇\", \"漪\", \"始\", \"钝\", \"易\", \"亿\", \"邢\", \"尖\", \"许\", \"孪\", \"希\", \"吵\", \"烊\", \"翘\", \"梯\", \"兔\", \"付\", \"鹉\", \"堡\", \"凭\", \"裂\", \"稳\", \"逻\", \"掐\", \"插\", \"→\", \"谚\", \"铎\", \"钱\", \"硕\", \"栗\", \"廉\", \"樱\", \"介\", \"哮\", \"毁\", \"▪\", \"毡\", \"护\", \"饶\", \"鹅\", \"穆\", \"攘\", \"焰\", \"战\", \"槐\", \"熟\", \"娼\", \"驼\", \"鉴\", \"叛\", \"诉\", \"驾\", \"缺\", \"籽\", \"撩\", \"侮\", \"控\", \"便\", \"闷\", \"透\", \"睽\", \"宏\", \"板\", \"宠\", \"耕\", \"添\", \"灑\", \"纷\", \"渲\", \"般\", \"函\", \"鹌\", \"唏\", \"蒸\", \"凰\", \"芭\", \"擅\", \"卑\", \"胶\", \"掠\", \"痰\", \"觅\", \"ヨ\", \"莅\", \"乡\", \"雁\", \"迄\", \"紫\", \"糠\", \"技\", \"址\", \"抹\", \"甘\", \"舐\", \"会\", \"汰\", \"吧\", \"念\", \"含\", \"垛\", \"咯\", \"耙\", \"鬓\", \"扒\", \"蹒\", \"啼\", \"明\", \"讨\", \"篝\", \"阻\", \"除\", \"茱\", \"想\", \"雪\", \"T\", \"忆\", \"轶\", \"秒\", \"缅\", \"轩\", \"屯\", \"廊\", \"坝\", \"淤\", \"旌\", \"草\", \"喃\", \"谔\", \"媒\", \"《\", \"攀\", \"北\", \"趋\", \"她\", \"悯\", \"衰\", \"汁\", \"举\", \"垃\", \"交\", \"懊\", \"⑨\", \"煮\", \"坊\", \"颇\", \"5\", \"弟\", \"偌\", \"铮\", \"由\", \"无\", \"葆\", \"佩\", \"较\", \"沂\", \"悲\", \"蔬\", \"啥\", \"鹤\", \"圾\", \"嚷\", \"歇\", \"进\", \"芬\", \"仓\", \"狈\", \"侯\", \"遛\", \"瞬\", \"發\", \"展\", \"拿\", \"构\", \"亏\", \"索\", \"忑\", \"摧\", \"源\", \"瑑\", \"科\", \"拱\", \"钜\", \"绵\", \"盼\", \"倜\", \"沧\", \"孟\", \"姜\", \"抵\", \"戸\", \"停\", \"犀\", \"驶\", \"俑\", \"漱\", \"锅\", \"寅\", \"湿\", \"噶\", \"沪\", \"韬\", \"致\", \"恃\", \"運\", \"镕\", \"怕\", \"艘\", \"航\", \"挚\", \"衍\", \"淅\", \"霹\", \"连\", \"咎\", \"讷\", \"剿\", \"娘\", \"普\", \"古\", \"榆\", \"翼\", \"邪\", \"假\", \"疆\", \"怵\", \"礴\", \"逃\", \"萨\", \"炼\", \"切\", \"涝\", \"嘿\", \"美\", \"卦\", \"篮\", \"洞\", \"外\", \"暂\", \"息\", \"柳\", \"趾\", \"蕴\", \"床\", \"窒\", \"肆\", \"逮\", \"獗\", \"魇\", \"运\", \"h\", \"模\", \"马\", \"琪\", \"崎\", \"哨\", \"黧\", \"『\", \"询\", \"枝\", \"樟\", \"丫\", \"旳\", \"拟\", \"旨\", \"菌\", \"瑥\", \"胁\", \"惚\", \"版\", \"虏\", \"浠\", \"妖\", \"妈\", \"栾\", \"瑒\", \"闲\", \"躬\", \"常\", \"锦\", \"绣\", \"语\", \"丑\", \"託\", \"绩\"]",
"reversible": false
},
"google/mt5-large @ cc100/zh-Hans": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2633047,
"_n_tokens": 621182,
"_n_chars": 927311,
"_n_oov_chars": 68514,
"oov_ratio": 0.07388459750827932,
"_oov_charset": "[\"℃\", \"⑤\", \"\\b\", \"+\", \"⒂\", \"\", \"&\", \"?\", \"⑸\", \"_\", \"⒃\", \"黩\", \"…\", \"r\", \"p\", \"\", \"鼯\", \"⑶\", \"4\", \"e\", \"7\", \"擤\", \"%\", \"C\", \"o\", \"s\", \"N\", \"�\", \"\", \"8\", \"棂\", \"n\", \";\", \"\\u0000\", \"⑷\", \" \", \"阽\", \"犰\", \"-\", \"⒁\", \"锒\", \"②\", \"D\", \"A\", \"T\", \"t\", \"]\", \"V\", \"\\u0006\", \"⑨\", \"・\", \"5\", \"③\", \"\", \"黢\", \"④\", \"⑦\", \"a\", \"⑥\", \".\", \"\\u0005\", \"⑧\", \"i\", \"/\", \"瑑\", \"⒋\", \"猡\", \"瑨\", \",\", \"d\", \"腭\", \"⒀\", \"佝\", \"9\", \"(\", \"篢\", \"1\", \"[\", \"⒌\", \"①\", \" \", \"6\", \"瑢\", \"⑿\", \"⑴\", \":\", \"!\", \"耩\", \" \", \"0\", \"h\", \"\", \"瑥\", \")\", \"2\", \"瑒\", \"\\u0007\", \"鲱\", \"3\", \"⑩\", \"\", \""\", \"犄\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/zh-Hans": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2633047,
"_n_tokens": 2523519,
"_n_chars": 927311,
"_n_oov_chars": 49191,
"oov_ratio": 0.05304692816110237,
"_oov_charset": "[\"℃\", \"⑤\", \"+\", \"⑷\", \"①\", \"⒂\", \" \", \" \", \"④\", \"⑦\", \"⒌\", \"&\", \"-\", \"6\", \"~\", \"⑿\", \"a\", \"⒁\", \"?\", \"⑴\", \"⑸\", \":\", \"_\", \"⑥\", \".\", \"!\", \"⒃\", \"⑧\", \"…\", \"r\", \"②\", \"D\", \"p\", \"0\", \"i\", \"/\", \"h\", \" \", \"⒋\", \"A\", \"T\", \"⑶\", \"t\", \"4\", \",\", \"⑩\", \"]\", \"e\", \"V\", \"7\", \"d\", \"%\", \"⒀\", \"9\", \"⑨\", \")\", \"・\", \"8\", \"(\", \"5\", \"2\", \"③\", \"C\", \"o\", \"s\", \"3\", \"1\", \"N\", \"[\", \""\", \"n\", \";\"]",
"reversible": false
},
"google/byt5-small @ cc100/en": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1124813,
"_n_tokens": 1124813,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/byt5-small @ cc100/zh-Hans": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2633047,
"_n_tokens": 2633047,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/en": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1124813,
"_n_tokens": 474941,
"_n_chars": 1121360,
"_n_oov_chars": 111,
"oov_ratio": 9.898694442462724e-05,
"_oov_charset": "[\"‑\", \"⑩\", \"´\", \"…\", \"¡\", \"\", \"\", \"ï\", \"ñ\", \"⑤\", \"~\", \"�\", \"\", \"\", \"⑦\", \"③\", \"\", \"⑧\", \"😥\", \"🙂\", \"😉\", \"¦\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/zh-Hans": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2633047,
"_n_tokens": 168974,
"_n_chars": 927311,
"_n_oov_chars": 864792,
"oov_ratio": 0.9325803317333667,
"_oov_charset": "[\"互\", \"徽\", \"馋\", \"吊\", \"蓄\", \"柜\", \"争\", \"创\", \"惟\", \"蚂\", \"權\", \"增\", \"嘟\", \"哧\", \"彼\", \"淤\", \"艘\", \"指\", \"界\", \"怜\", \"吱\", \"能\", \"拗\", \"闯\", \"惮\", \"聘\", \"炫\", \"陋\", \"惩\", \"钉\", \"灿\", \"愉\", \"贩\", \"讥\", \"凝\", \"眨\", \"拷\", \"规\", \"e\", \"锋\", \"少\", \"闭\", \"咎\", \"札\", \"憔\", \"戢\", \"旌\", \"采\", \"盾\", \"俯\", \"东\", \"橄\", \"沥\", \"呵\", \"里\", \"喽\", \"旎\", \"毗\", \"时\", \"潢\", \"框\", \"抗\", \"挖\", \"誓\", \"鸩\", \"鹦\", \"房\", \"嘎\", \"论\", \"下\", \"降\", \"胥\", \"标\", \".\", \"遍\", \"双\", \"彭\", \"拖\", \"清\", \"糯\", \"醇\", \"懵\", \"梗\", \"湃\", \"腱\", \"瓣\", \"馁\", \"芭\", \"科\", \"讷\", \"渲\", \"厉\", \"魂\", \"拼\", \"它\", \"柘\", \"猬\", \"吕\", \"仪\", \"咬\", \"以\", \"并\", \"厘\", \"荼\", \"樱\", \"铎\", \"颜\", \"炝\", \"腹\", \"颊\", \"笆\", \"荷\", \"摊\", \"线\", \"选\", \"滔\", \"斛\", \"袭\", \"耽\", \"读\", \"蒂\", \"孔\", \"顷\", \"飘\", \"属\", \"渎\", \"菩\", \"作\", \"焊\", \"劑\", \")\", \"淮\", \"低\", \"临\", \"强\", \"端\", \"哼\", \"沸\", \"膳\", \"期\", \"势\", \"等\", \"厮\", \"呗\", \"毎\", \"赘\", \"具\", \"僻\", \"-\", \"韵\", \"足\", \"口\", \"罹\", \"绘\", \"担\", \"斤\", \"登\", \"岣\", \"例\", \"坝\", \"癖\", \"泠\", \"巷\", \"ο\", \"阻\", \"曝\", \"寨\", \"民\", \"输\", \"湖\", \"娩\", \"垫\", \"蜥\", \"诵\", \"给\", \"毯\", \"蔓\", \"琉\", \"浑\", \"刷\", \"娄\", \"喜\", \"烯\", \"璇\", \"猝\", \"歌\", \"茨\", \"检\", \"膝\", \"揖\", \"希\", \"夏\", \"温\", \"鼠\", \"症\", \"噪\", \"赐\", \"洒\", \"A\", \"矗\", \"元\", \"病\", \"妒\", \"娱\", \"画\", \"倍\", \"夹\", \"汪\", \"截\", \"靛\", \"贾\", \"天\", \"暗\", \"吉\", \"媲\", \"坡\", \"巧\", \"绊\", \"忠\", \"饵\", \"千\", \"全\", \"坛\", \"藤\", \"崩\", \"伤\", \"姻\", \"阪\", \"五\", \"顽\", \"裸\", \"滞\", \"驳\", \"瑕\", \"菜\", \"葵\", \"邻\", \"司\", \"恋\", \"撕\", \"〃\", \"蹴\", \"硬\", \"幼\", \"咸\", \"甸\", \"围\", \"迹\", \"漆\", \"旱\", \"狰\", \"睹\", \"笨\", \"蘸\", \"沼\", \"踏\", \"席\", \"豁\", \"楚\", \"晖\", \"哗\", \"膏\", \"查\", \"沟\", \"泛\", \"韧\", \"昆\", \"晶\", \"局\", \"耿\", \"特\", \"谩\", \"怕\", \"毫\", \"苹\", \"喔\", \"尖\", \"腐\", \"嗦\", \"镳\", \"炉\", \"跳\", \"暖\", \"陷\", \"藏\", \"导\", \"升\", \"奢\", \"熹\", \"砍\", \"咏\", \"④\", \"诙\", \"戸\", \"怡\", \"胡\", \"瞒\", \"糕\", \"捡\", \"荒\", \"磋\", \"购\", \"啡\", \"盯\", \"帜\", \"℃\", \"遢\", \"荣\", \"央\", \"喘\", \"旺\", \"孙\", \"颁\", \"宝\", \"莴\", \"腓\", \"篷\", \"序\", \"泾\", \"众\", \"慑\", \"宇\", \"窜\", \"芙\", \"拐\", \"声\", \"肾\", \"文\", \"域\", \"济\", \"南\", \"渊\", \"颖\", \"隔\", \"墉\", \"择\", \"尾\", \"兹\", \"栋\", \"村\", \"敛\", \"筷\", \"蝌\", \"霈\", \"怠\", \"胖\", \"基\", \"诶\", \"酬\", \"柱\", \"耩\", \"玖\", \"伊\", \"涟\", \"・\", \"扁\", \"戚\", \"孤\", \"怨\", \"拿\", \"烷\", \"竣\", \"啦\", \"屑\", \"酣\", \"列\", \"沾\", \"裔\", \"摇\", \"接\", \"战\", \"渴\", \"昕\", \"罄\", \"匆\", \"谧\", \"屏\", \"索\", \"饱\", \"褚\", \"硫\", \"捧\", \"鲸\", \"扶\", \"抑\", \"炬\", \"濒\", \"斧\", \"笔\", \"卷\", \"耕\", \"钩\", \"我\", \"异\", \"距\", \"勿\", \"價\", \"锁\", \"兴\", \"助\", \"跌\", \"尽\", \"苯\", \"研\", \"事\", \"楂\", \"瞠\", \"辜\", \"崖\", \"N\", \"叭\", \"铜\", \"效\", \"磨\", \"纨\", \"昨\", \"·\", \"徳\", \"皙\", \"熏\", \"龚\", \"挤\", \"雄\", \"惕\", \"猖\", \"浮\", \"旖\", \"晒\", \"讨\", \"束\", \"蛔\", \"然\", \"普\", \"砸\", \"阐\", \"么\", \"α\", \"芹\", \"位\", \"睁\", \"安\", \"甜\", \"石\", \"璃\", \"根\", \"贿\", \"馈\", \"唉\", \"超\", \"杂\", \"勋\", \"鳗\", \"爷\", \"诩\", \"汩\", \"追\", \"啥\", \"嗲\", \"度\", \"筛\", \"需\", \"棘\", \"撰\", \"覃\", \"郎\", \"焰\", \"牠\", \"龙\", \"抠\", \"淡\", \"暨\", \"哈\", \"刃\", \"允\", \"证\", \"腕\", \"蒙\", \"丢\", \"峰\", \"犀\", \"3\", \"耀\", \"当\", \"其\", \"昵\", \"毕\", \"七\", \"褒\", \"萧\", \"渤\", \"揽\", \"揉\", \"鸟\", \"驴\", \"句\", \"仁\", \"辰\", \"蝶\", \"啜\", \"鹕\", \"书\", \"、\", \"亿\", \"迷\", \"薪\", \"邮\", \"忙\", \"忱\", \"损\", \"梧\", \"墅\", \"敝\", \"品\", \"手\", \"连\", \"频\", \"好\", \"得\", \"塑\", \"尝\", \"剥\", \"雇\", \"弯\", \"鸽\", \"器\", \"诱\", \"缺\", \"晋\", \"祈\", \"雀\", \"纹\", \"慷\", \"巅\", \"皈\", \"努\", \"烟\", \"奈\", \"抛\", \"岂\", \"法\", \"针\", \"圆\", \"炸\", \"机\", \"松\", \"谷\", \"胆\", \"延\", \"搬\", \"炅\", \"商\", \"津\", \"大\", \"娼\", \"电\", \"料\", \"荐\", \"勤\", \"铭\", \"[\", \"肮\", \"罔\", \"瘠\", \"壳\", \"薯\", \"湘\", \"仅\", \"灑\", \"妆\", \"媛\", \"郡\", \"李\", \"险\", \"胺\", \"拂\", \"撬\", \"圳\", \"乡\", \"诨\", \"薛\", \"赛\", \"孰\", \"煎\", \"鹜\", \"握\", \"袍\", \"拢\", \"疾\", \"瘫\", \"%\", \"唆\", \"桩\", \"贤\", \"拓\", \"视\", \"冬\", \"谔\", \"辑\", \"没\", \"悔\", \"搏\", \"岛\", \"吆\", \"绍\", \"佐\", \"拍\", \"滴\", \"豌\", \"壑\", \"眷\", \"〝\", \"憧\", \"暑\", \"敖\", \"湿\", \"榭\", \"碱\", \"隙\", \"帐\", \"诣\", \"抬\", \"冽\", \"嫖\", \"投\", \"メ\", \"蔽\", \"內\", \"乓\", \"胀\", \"蟀\", \"公\", \"孩\", \"馒\", \"旳\", \"梯\", \"先\", \"p\", \"氮\", \"谢\", \"壶\", \"锣\", \"发\", \"稽\", \"滕\", \"锚\", \"含\", \"币\", \"宜\", \"腥\", \"盘\", \"狸\", \"啕\", \"羔\", \"榴\", \"睦\", \"眼\", \"萍\", \"矛\", \"舟\", \"彷\", \"沧\", \"〈\", \"锒\", \"颌\", \"涩\", \"丛\", \"善\", \"槛\", \"让\", \"析\", \"狼\", \"醒\", \"疚\", \"赔\", \"稣\", \"棱\", \"筐\", \"疯\", \"杰\", \"甲\", \"茂\", \"琅\", \"樯\", \"ὐ\", \"诬\", \"债\", \"蜡\", \"蜂\", \"跟\", \"悄\", \"戮\", \"蚀\", \"竺\", \"职\", \"⒌\", \"譬\", \"翊\", \"倦\", \"牲\", \"铤\", \"乏\", \"伟\", \"攫\", \"瘙\", \"孀\", \"龇\", \"页\", \"溜\", \"岁\", \"竹\", \"版\", \"恭\", \"瑒\", \"额\", \"朦\", \"窃\", \"贝\", \"氧\", \"梳\", \"俗\", \"徇\", \"详\", \"舆\", \"瓦\", \"思\", \"沿\", \"桌\", \"至\", \"礁\", \"撐\", \""\", \"自\", \"九\", \"精\", \"串\", \"成\", \"粥\", \"雯\", \"或\", \"净\", \"员\", \"宫\", \"秃\", \"汶\", \"婴\", \"嘘\", \"联\", \"嗤\", \"刻\", \"份\", \"涣\", \"磁\", \"8\", \"议\", \"暂\", \"咨\", \"t\", \"淳\", \"靶\", \"漏\", \"谈\", \"徐\", \"茅\", \"拜\", \"徙\", \"痴\", \"馨\", \"岚\", \"丝\", \"鲤\", \"咖\", \"食\", \"储\", \"蹲\", \"包\", \"锻\", \"锅\", \"禽\", \"冻\", \"碍\", \"悟\", \"间\", \"远\", \"蛋\", \"技\", \"曾\", \"童\", \"邹\", \"佝\", \"臭\", \"旗\", \"营\", \"惜\", \"澳\", \"標\", \"龄\", \"顶\", \"⑿\", \"律\", \"柿\", \"鲎\", \"类\", \"汀\", \"坞\", \"袜\", \"汽\", \"匈\", \"羡\", \"盼\", \"草\", \"断\", \"躇\", \"迄\", \"奘\", \"诞\", \"艰\", \"迤\", \"韪\", \"逢\", \"花\", \"暇\", \"记\", \"厢\", \"铨\", \"肘\", \"卵\", \"酸\", \"穴\", \"稀\", \"族\", \"憨\", \"藐\", \"聋\", \"嫂\", \"别\", \"朱\", \"庚\", \"膀\", \"葡\", \"螂\", \"靡\", \"雨\", \"芬\", \"ト\", \"裴\", \"娜\", \"璜\", \"夜\", \"早\", \"宸\", \"密\", \"蕾\", \"保\", \"诀\", \"兔\", \"裳\", \"秽\", \"诗\", \"嘈\", \"孽\", \"幢\", \"皖\", \"採\", \"挨\", \"丙\", \"爻\", \"佼\", \"阮\", \"妞\", \"痒\", \"掰\", \"哉\", \"胚\", \"值\", \"很\", \"嚼\", \"展\", \"啐\", \"↑\", \"危\", \"厕\", \"盎\", \"轮\", \"烹\", \"哪\", \"实\", \"库\", \"隶\", \"趟\", \"涸\", \"尼\", \"雪\", \"袋\", \"速\", \"把\", \"寒\", \"泉\", \"菁\", \"治\", \"蔷\", \"谴\", \"尴\", \"迁\", \"吠\", \"献\", \"整\", \"籍\", \"蓁\", \"亡\", \"榻\", \"搀\", \"意\", \"魏\", \"犯\", \"碾\", \"逃\", \"泱\", \"匠\", \"考\", \"粹\", \"妥\", \"慧\", \"坯\", \"吻\", \"凯\", \"想\", \"识\", \"萦\", \"踝\", \"弈\", \"笛\", \"欺\", \"妮\", \"恤\", \"宵\", \"虫\", \"(\", \"吵\", \"杖\", \"劳\", \"泸\", \"萃\", \"乒\", \"吸\", \"闹\", \"沪\", \"イ\", \"溉\", \"智\", \"尺\", \"怪\", \"嗨\", \"荧\", \"曙\", \"共\", \"芯\", \"威\", \"赖\", \"消\", \"条\", \"顺\", \"馄\", \"赚\", \"桅\", \"牡\", \"啸\", \"冷\", \"则\", \"邀\", \"餐\", \"陇\", \"滚\", \"爬\", \"省\", \"坪\", \"矣\", \"练\", \"嬉\", \"玛\", \"聚\", \"選\", \"继\", \"姐\", \"贼\", \"量\", \"灰\", \"宿\", \"姬\", \"蠢\", \"站\", \"狠\", \"亚\", \" \", \"承\", \"躲\", \"踪\", \"跷\", \"挟\", \"愈\", \"枚\", \"话\", \"孵\", \"闻\", \"驼\", \"边\", \"呃\", \"π\", \"激\", \"惋\", \"弑\", \"闪\", \"办\", \"霄\", \"齐\", \"奚\", \"吼\", \"蜀\", \"妓\", \"弗\", \"滢\", \"邯\", \"笑\", \"羞\", \"皱\", \"琶\", \"除\", \"道\", \"香\", \"观\", \"轴\", \"贺\", \"吨\", \"财\", \"责\", \"久\", \"柔\", \"粮\", \"膊\", \"绝\", \"涅\", \"软\", \"估\", \"型\", \"邦\", \"欣\", \"膨\", \"儿\", \"架\", \"暹\", \"逸\", \"函\", \"屄\", \"独\", \"的\", \"娟\", \"佳\", \"豫\", \"h\", \"活\", \"莎\", \"塞\", \"分\", \"捷\", \"倾\", \"哲\", \"殆\", \"臃\", \"兵\", \"邂\", \"崎\", \"疵\", \"古\", \"硅\", \"壓\", \"饰\", \"钟\", \"弛\", \"占\", \"笼\", \"滨\", \"妤\", \"喉\", \"_\", \"就\", \"彪\", \"启\", \"缩\", \"余\", \"雁\", \"讲\", \"慕\", \"无\", \"骚\", \"委\", \"亲\", \"媳\", \"埔\", \"巡\", \"恪\", \"伫\", \"垄\", \"茵\", \"训\", \"惚\", \"录\", \"鞋\", \"戳\", \"盆\", \"栈\", \"造\", \"依\", \"悲\", \"岗\", \"丐\", \"婿\", \"繁\", \"躬\", \"伴\", \"脉\", \"老\", \"遇\", \"蜜\", \"烙\", \"扪\", \"节\", \"够\", \"群\", \"拎\", \"涂\", \"咧\", \"扼\", \"妊\", \"呐\", \"棒\", \"珊\", \"侠\", \"游\", \"窗\", \"娶\", \"讦\", \"唬\", \"似\", \"棵\", \"巢\", \"尧\", \"剂\", \"影\", \"糖\", \"哀\", \"谜\", \"绉\", \"→\", \"衿\", \"煽\", \"擤\", \"茜\", \"攒\", \"偎\", \"τ\", \"抹\", \"露\", \"闸\", \"帅\", \"西\", \"扬\", \"调\", \"诊\", \"循\", \"陕\", \"亭\", \"\", \"裕\", \"男\", \"荫\", \"仗\", \"咒\", \"牒\", \"闲\", \"窖\", \"俱\", \"毒\", \"钊\", \"簧\", \"验\", \"凌\", \"霏\", \"※\", \"睐\", \"岖\", \"甯\", \"档\", \"减\", \"猡\", \"霾\", \"换\", \"籽\", \"浇\", \"辛\", \"像\", \"巴\", \"哺\", \" \", \"鬓\", \"榷\", \"侃\", \"邓\", \"伐\", \"烂\", \"皿\", \"另\", \"嗅\", \"旁\", \"翩\", \"芦\", \"唾\", \"桑\", \"奋\", \"崔\", \"泥\", \"莓\", \"C\", \"摞\", \"ズ\", \"察\", \"白\", \"程\", \"肯\", \"欲\", \"俨\", \"囚\", \"d\", \"社\", \"住\", \"顿\", \"撑\", \"褪\", \"陆\", \"锥\", \"征\", \"躺\", \"轰\", \"素\", \"垛\", \"穰\", \"转\", \"烘\", \"】\", \"瞬\", \"煲\", \"乐\", \"丫\", \"径\", \"晴\", \"咕\", \"纽\", \"惹\", \"眺\", \"侥\", \"呷\", \"苦\", \"坂\", \"卑\", \"削\", \"遗\", \"租\", \"匹\", \"跨\", \"牧\", \"俘\", \"穗\", \"欧\", \"健\", \"掩\", \"「\", \"御\", \"沙\", \"寂\", \"朴\", \"蹦\", \"裘\", \"溯\", \"祢\", \"捏\", \"吮\", \"噬\", \"脂\", \"招\", \"女\", \"钻\", \"旷\", \"剩\", \"吭\", \"沂\", \"唱\", \"义\", \"均\", \"蹒\", \"厅\", \"括\", \"岳\", \"惦\", \"鲁\", \"嘻\", \"5\", \"颐\", \"万\", \"舀\", \"盐\", \"罩\", \"谱\", \"贵\", \"突\", \"噌\", \"泣\", \"乃\", \"舅\", \"瞄\", \"晦\", \"禾\", \"梢\", \"蜷\", \"旬\", \"绛\", \"D\", \"祖\", \"既\", \"鄯\", \"甚\", \"腋\", \"辙\", \"挈\", \"遐\", \"瑥\", \"礼\", \"茎\", \"罢\", \"掖\", \"垒\", \"釜\", \"飕\", \"妇\", \"霉\", \"噩\", \"热\", \"召\", \"供\", \"肖\", \"阑\", \"宰\", \"癌\", \"推\", \"中\", \"恃\", \"○\", \"嫌\", \"贬\", \"赃\", \"尊\", \"朗\", \"俚\", \"祀\", \"屹\", \"1\", \"▪\", \"赴\", \"言\", \"介\", \"订\", \"憾\", \"盟\", \"王\", \"巍\", \"員\", \"燎\", \"寐\", \"插\", \"触\", \"嗓\", \"虚\", \"擅\", \"逼\", \"策\", \"腭\", \"携\", \"垂\", \"扭\", \"灸\", \"⒀\", \"真\", \"株\", \"偶\", \"遑\", \"椒\", \"瞎\", \"腻\", \"八\", \"概\", \"词\", \"铣\", \"捅\", \"诅\", \"移\", \"跻\", \"押\", \"薩\", \"淅\", \"漩\", \"帷\", \"封\", \"逾\", \"痹\", \"砂\", \"蟹\", \"卜\", \"洲\", \"育\", \"管\", \"马\", \"胎\", \"叼\", \"焙\", \"吗\", \"①\", \"色\", \"恙\", \"开\", \"秸\", \"枣\", \"矶\", \"烛\", \"将\", \"逞\", \"祸\", \"镑\", \"臣\", \"⑷\", \"唏\", \"\", \"©\", \"牟\", \"都\", \"庭\", \"钱\", \"冥\", \"什\", \"亏\", \"免\", \"兼\", \"删\", \"奶\", \"母\", \"顾\", \"诡\", \"卦\", \"裁\", \"方\", \"冲\", \"祭\", \"蜿\", \"寺\", \"栾\", \"箔\", \"该\", \"编\", \"槃\", \"伞\", \"睑\", \"纰\", \"差\", \"心\", \"朝\", \"趾\", \"婷\", \"宋\", \"仍\", \"睽\", \"悍\", \"臀\", \"嗡\", \"积\", \"驶\", \"毅\", \"亩\", \"礴\", \"浏\", \"眶\", \"9\", \"颓\", \"唷\", \"靠\", \"糊\", \"瞩\", \"瑑\", \"学\", \"s\", \"拥\", \"辄\", \"轻\", \"淄\", \"幻\", \"泪\", \"酝\", \"楣\", \"失\", \"拆\", \"椅\", \"桓\", \"伏\", \"唇\", \"篮\", \"洼\", \"涌\", \"毋\", \"郊\", \"缉\", \"绒\", \"怂\", \"贞\", \"朔\", \"窒\", \"萨\", \"黢\", \"禁\", \"网\", \"誉\", \"杆\", \"悚\", \"谐\", \"猴\", \"诸\", \"君\", \"婉\", \"珠\", \"玻\", \"权\", \"操\", \"魔\", \"龟\", \"六\", \"警\", \"咪\", \"郸\", \"肛\", \"恩\", \"错\", \"谋\", \"散\", \"雍\", \"镇\", \"史\", \"戏\", \"磊\", \"娑\", \"亦\", \"絮\", \"\", \"…\", \"桥\", \"城\", \"窘\", \"勉\", \"寻\", \"亮\", \"械\", \"呢\", \"短\", \"柑\", \"弃\", \"骰\", \"艇\", \"旭\", \"听\", \"飞\", \"兆\", \"桂\", \"竟\", \"救\", \"倡\", \"宴\", \"农\", \"踊\", \"乱\", \"祛\", \"骨\", \"沈\", \"滤\", \"魇\", \"林\", \"欢\", \"髦\", \"琐\", \"窦\", \"艺\", \"紫\", \"溃\", \"宙\", \"凤\", \"V\", \"补\", \"工\", \"肋\", \"越\", \"克\", \"斌\", \"印\", \"孝\", \"由\", \"缄\", \"T\", \"如\", \"更\", \"娃\", \"于\", \"蛇\", \"斯\", \"通\", \"摔\", \"歹\", \"废\", \"刹\", \"稍\", \"致\", \"妈\", \"约\", \"柳\", \"漲\", \"灵\", \"秒\", \"镶\", \"肇\", \"纪\", \"脚\", \"贮\", \"缔\", \"名\", \"喷\", \"剧\", \"舰\", \"撤\", \"院\", \"半\", \"琢\", \"图\", \"享\", \"沁\", \"辨\", \"迈\", \"映\", \"堤\", \"芳\", \"励\", \"块\", \"\", \"夷\", \"支\", \"漉\", \"举\", \"显\", \"链\", \"景\", \"敷\", \"后\", \"蒋\", \"扳\", \"蚌\", \"诲\", \"惴\", \"烧\", \"帕\", \"槌\", \"芮\", \"功\", \"态\", \"浞\", \"笃\", \"切\", \"偿\", \"锤\", \"锏\", \"卉\", \"酋\", \"煜\", \"嘲\", \"烫\", \"裂\", \"注\", \"踱\", \"弹\", \"楔\", \"哥\", \"跑\", \"屁\", \"姚\", \"枕\", \"邵\", \"痘\", \"困\", \"击\", \"秤\", \"人\", \"豹\", \"玩\", \"谅\", \"轨\", \"玷\", \"門\", \"邬\", \"渝\", \"茏\", \"晨\", \"囤\", \"悖\", \"酥\", \"甄\", \"这\", \"绎\", \"蓦\", \"翠\", \"涕\", \"终\", \"吴\", \"懑\", \"纤\", \"且\", \"建\", \"宏\", \"促\", \"鸥\", \"淹\", \"哑\", \"与\", \"待\", \"搞\", \"适\", \"滥\", \"笋\", \"黯\", \"段\", \"昌\", \"郅\", \"戾\", \"翰\", \"秉\", \"壁\", \"她\", \"穷\", \"忿\", \"请\", \"挝\", \"姊\", \"负\", \"药\", \"退\", \"缪\", \"忑\", \"郜\", \"倘\", \"贡\", \"绞\", \"田\", \"晕\", \"格\", \"沐\", \"资\", \"泳\", \"伽\", \"谆\", \"秆\", \"梦\", \"炮\", \"鬣\", \"养\", \"泰\", \"」\", \"/\", \"润\", \"脐\", \"挠\", \"片\", \"迦\", \"厨\", \"糠\", \"狄\", \"×\", \"疤\", \"结\", \"骅\", \"纸\", \"嘤\", \"护\", \"姣\", \"檀\", \"嚷\", \"左\", \"弟\", \"滩\", \"船\", \"情\", \"衡\", \"绸\", \"嘭\", \"知\", \"固\", \"柄\", \"防\", \"衔\", \"恰\", \"號\", \"脏\", \"脑\", \"尿\", \"雕\", \"滇\", \"邕\", \"诈\", \"河\", \"纬\", \"瞻\", \",\", \"茱\", \"辫\", \"座\", \"■\", \"到\", \"驻\", \"莞\", \"二\", \"峻\", \"翌\", \"俊\", \"殷\", \"鼾\", \"驰\", \"澎\", \"卖\", \"岑\", \"粪\", \"授\", \"飓\", \"彤\", \"曹\", \"尤\", \"墒\", \"嘉\", \"澜\", \"豚\", \"掉\", \"入\", \"讼\", \"鉴\", \"所\", \"沃\", \"\\u0005\", \"呛\", \"环\", \"易\", \"从\", \"晗\", \"★\", \"缝\", \"矮\", \"個\", \"督\", \"僵\", \"绕\", \"火\", \"叔\", \"溶\", \"蚤\", \"未\", \"搭\", \"矍\", \"膜\", \"慈\", \"屯\", \"芽\", \"臻\", \"宾\", \"驾\", \"奥\", \"反\", \"铂\", \"休\", \"广\", \"朵\", \"桔\", \"颈\", \"赵\", \"潘\", \"旦\", \"黎\", \"仿\", \"监\", \"盒\", \"敲\", \"守\", \"脆\", \"珞\", \"略\", \"江\", \"阴\", \"啪\", \"狩\", \"每\", \"搜\", \"暮\", \"演\", \"乌\", \"�\", \"唠\", \"惘\", \"甘\", \"捕\", \"癫\", \"臊\", \"蔚\", \"哄\", \"!\", \"猩\", \"确\", \"渔\", \"禄\", \"冶\", \"⒂\", \"霓\", \"锯\", \"曰\", \"镍\", \"岔\", \"⑸\", \"矫\", \"课\", \"丹\", \"掷\", \"锲\", \"徘\", \"官\", \"樟\", \"奎\", \"曲\", \"础\", \"潦\", \"劲\", \"抖\", \"懂\", \"揣\", \"筒\", \"轶\", \"擘\", \"十\", \"【\", \"世\", \"语\", \"攸\", \"舱\", \"勖\", \"咆\", \"愚\", \"教\", \"讽\", \"猪\", \"执\", \"项\", \"层\", \"店\", \"傅\", \"逝\", \"曦\", \"钞\", \"呻\", \"满\", \"弘\", \"灌\", \"役\", \"煤\", \"雏\", \"埋\", \"屡\", \"裤\", \"锐\", \"侧\", \"测\", \"敬\", \"腊\", \"四\", \"冒\", \"粘\", \"併\", \"碗\", \"体\", \"附\", \"菲\", \"磕\", \"尸\", \"讶\", \"市\", \"渐\", \"丰\", \"罚\", \"缈\", \"屣\", \"丧\", \"比\", \"拇\", \"付\", \"瑨\", \"黧\", \"捞\", \"踌\", \"洁\", \"翼\", \"纯\", \"爸\", \"麾\", \"装\", \"挑\", \"弥\", \"灼\", \"示\", \"鸣\", \"枢\", \"窝\", \"见\", \"纠\", \"憬\", \"杭\", \"耐\", \"摘\", \"届\", \"神\", \"贯\", \"茫\", \"氏\", \"哇\", \"饶\", \"7\", \"報\", \"雳\", \"屌\", \"熊\", \"侮\", \"锦\", \"炕\", \"光\", \"涵\", \"郑\", \"韫\", \"骁\", \"日\", \"帘\", \"角\", \"认\", \";\", \"陡\", \"艋\", \"耶\", \"革\", \"带\", \"圭\", \"盈\", \"ㄓ\", \"居\", \"物\", \"弱\", \"楷\", \"浩\", \"第\", \"铲\", \"狮\", \"癜\", \"头\", \"刑\", \"葱\", \"烬\", \"庐\", \"凛\", \"酪\", \"钧\", \"园\", \"何\", \"雾\", \"诧\", \"淘\", \"陈\", \"霜\", \"叙\", \"射\", \"姆\", \"便\", \"点\", \"县\", \"浠\", \"凡\", \"班\", \"恕\", \"衰\", \"艳\", \"瞳\", \"修\", \"彻\", \"摩\", \"募\", \"骸\", \"n\", \"へ\", \"煞\", \"忧\", \"妻\", \"泡\", \"沏\", \"澄\", \"薇\", \"痕\", \"算\", \"壤\", \"挫\", \"佬\", \"炎\", \"蹩\", \"赞\", \"关\", \"锌\", \"布\", \"绅\", \"侵\", \"辕\", \"述\", \"喃\", \"侦\", \"骗\", \"送\", \"酌\", \"匀\", \"圾\", \"黛\", \"耦\", \"赋\", \"葆\", \"区\", \"\\u0007\", \"丸\", \"使\", \"蝉\", \"恢\", \"勇\", \"旆\", \"俭\", \"奏\", \"蛊\", \"衫\", \"枉\", \"细\", \"取\", \"镉\", \"肢\", \"泵\", \"仔\", \"鹌\", \"桃\", \"鹤\", \"腿\", \"栽\", \"谊\", \"哒\", \"踞\", \"筑\", \"灶\", \"伸\", \"―\", \"措\", \"敞\", \"攥\", \"赶\", \"恶\", \"鱼\", \"亵\", \"签\", \"着\", \"洛\", \"汕\", \"殴\", \"拱\", \"萝\", \"彩\", \"床\", \"肝\", \"川\", \"掐\", \"志\", \"妨\", \"评\", \"驱\", \"簿\", \"o\", \"耻\", \"前\", \"土\", \"啼\", \"貂\", \"狞\", \"履\", \"&\", \"◆\", \"添\", \"芜\", \"虽\", \"彙\", \"僧\", \"・\", \"伉\", \"原\", \"辱\", \"朽\", \"嘛\", \"扒\", \"窟\", \"理\", \"唐\", \"眉\", \"仕\", \"纂\", \"踢\", \"绿\", \"铮\", \"倩\", \"绵\", \"掺\", \"邢\", \"昧\", \"寸\", \"祟\", \"哎\", \"舛\", \"仆\", \"跚\", \"脊\", \"淫\", \"湾\", \"访\", \"梁\", \"续\", \"檬\", \"优\", \"夯\", \"當\", \"劫\", \"ě\", \"猜\", \"非\", \"铛\", \"帽\", \"柴\", \"邪\", \"浪\", \"婚\", \"曼\", \"姜\", \"蛮\", \"剐\", \"肉\", \"缅\", \"砾\", \"灾\", \"塔\", \"姓\", \"茶\", \"溢\", \"若\", \"亳\", \"斗\", \"山\", \"辅\", \"杏\", \"栩\", \"哭\", \"鲨\", \"酒\", \"堰\", \"疙\", \"聒\", \"闷\", \"呀\", \"勺\", \"檐\", \"忆\", \"〔\", \"嗯\", \"阔\", \"阜\", \"凄\", \"醋\", \"沫\", \"符\", \"凹\", \"球\", \"此\", \"戈\", \"户\", \"蜘\", \"缘\", \"砥\", \"税\", \"焉\", \"③\", \"+\", \"蚓\", \"咙\", \"怔\", \"晤\", \"臆\", \"乖\", \"室\", \"陪\", \"槽\", \"加\", \"池\", \"恍\", \"碟\", \"篡\", \"彦\", \"奖\", \"拟\", \"胜\", \"匾\", \"泽\", \"柠\", \"弧\", \"膛\", \"屈\", \"圩\", \"况\", \"悼\", \"门\", \"术\", \"饮\", \"湄\", \"勒\", \"饲\", \"络\", \"喝\", \"象\", \"样\", \"计\", \"荨\", \"圜\", \"剑\", \"锂\", \"服\", \"不\", \"逻\", \"出\", \"任\", \"峡\", \"德\", \"嗣\", \"皮\", \"飙\", \"菌\", \"契\", \"铄\", \"鞘\", \"姑\", \"贱\", \"萄\", \"销\", \"抢\", \"翻\", \"刮\", \"涛\", \"拾\", \"爆\", \"茁\", \"姥\", \"忡\", \"歼\", \"厄\", \"票\", \"歉\", \"襟\", \"姨\", \"芒\", \"扉\", \"捂\", \"昔\", \"腑\", \"▲\", \"脱\", \"路\", \"搐\", \"冯\", \"侄\", \"怵\", \"国\", \"迟\", \"紊\", \"遛\", \"残\", \"进\", \"篱\", \"袖\", \"汇\", \"箭\", \"腔\", \"背\", \"茄\", \"苑\", \"漪\", \"谦\", \"乞\", \"春\", \"挣\", \"舞\", \"怯\", \"肤\", \"逑\", \"汛\", \"息\", \"玮\", \"嫩\", \"鹭\", \"合\", \"娛\", \"荻\", \"虞\", \"党\", \"胫\", \"煌\", \"觑\", \"谀\", \"惺\", \"畑\", \"鹑\", \"利\", \"幅\", \"咚\", \"蕴\", \"垮\", \"铃\", \"落\", \"惊\", \"范\", \"陵\", \"甫\", \"饷\", \"弓\", \"扯\", \"酵\", \"戍\", \"嗔\", \"配\", \"饭\", \"饼\", \"荏\", \"胳\", \"呦\", \"蚯\", \"汗\", \"蜃\", \"呼\", \"荡\", \"吐\", \"诠\", \"吾\", \"竖\", \"⒃\", \"麻\", \"●\", \"帮\", \"恨\", \"改\", \"敢\", \"惯\", \"獗\", \"状\", \"琛\", \"瞰\", \"枯\", \"瑜\", \"耙\", \"嵘\", \"副\", \"ソ\", \"恒\", \"娠\", \"嘣\", \"末\", \"確\", \"摸\", \"苛\", \"谍\", \"贴\", \"慎\", \"巾\", \"磺\", \"鑫\", \"娴\", \"新\", \"多\", \"讪\", \"『\", \"狙\", \"埠\", \"淀\", \"敌\", \"遏\", \"儒\", \"憋\", \"壹\", \"耸\", \"正\", \"乎\", \"睫\", \"留\", \"碳\", \"键\", \"晃\", \"辐\", \"脾\", \"虐\", \"峥\", \"饿\", \"一\", \"往\", \"级\", \"跤\", \"墨\", \"目\", \"纳\", \"攀\", \"夺\", \"邑\", \"排\", \"⑶\", \"屋\", \"袁\", \"皂\", \"凶\", \"初\", \"晰\", \"疲\", \"扛\", \"晟\", \"渡\", \"藕\", \"楼\", \"剽\", \"累\", \"澡\", \"氰\", \"婺\", \"卓\", \"炒\", \"栗\", \"植\", \"弦\", \"泼\", \"诫\", \"杠\", \"逅\", \"庄\", \"平\", \"羹\", \"喀\", \"竿\", \"逛\", \"矿\", \"钵\", \"搅\", \"牌\", \"醛\", \"变\", \"攘\", \"预\", \"葛\", \"套\", \"娇\", \"兄\", \"贷\", \"慌\", \"箱\", \"衣\", \"颧\", \"粤\", \"円\", \"兮\", \"贪\", \"偷\", \"喂\", \"肆\", \"果\", \"貌\", \"渣\", \"板\", \"载\", \"铺\", \"抚\", \"莉\", \"逍\", \"昭\", \"臼\", \"郁\", \"被\", \"嫁\", \"黏\", \"颠\", \"撒\", \"珍\", \"快\", \"薄\", \"兰\", \"桢\", \"黔\", \"坚\", \"试\", \"专\", \"愿\", \"榆\", \"荤\", \"珉\", \"鬼\", \"傻\", \"0\", \"犰\", \"朋\", \"羁\", \"邱\", \"璧\", \"暴\", \"賣\", \"凑\", \"耘\", \"嗪\", \"⑦\", \"刁\", \"仄\", \"嘿\", \"尘\", \"魅\", \"寥\", \"染\", \"夕\", \"忍\", \"死\", \"髓\", \"叛\", \"野\", \"惨\", \"託\", \"褂\", \"浸\", \"璎\", \"障\", \"说\", \"趴\", \"唤\", \"习\", \"犄\", \"铝\", \"←\", \"伯\", \"运\", \"ヨ\", \"狳\", \":\", \"蒸\", \"经\", \"备\", \"淇\", \"风\", \"の\", \"撩\", \"典\", \"徊\", \"疗\", \"潮\", \"踩\", \"橘\", \"粉\", \"柏\", \"严\", \"气\", \"黄\", \"雌\", \"阂\", \"耍\", \"衬\", \"怀\", \"撅\", \"各\", \"令\", \"瑶\", \"倨\", \"姿\", \"逆\", \"筋\", \"岌\", \"秋\", \"躯\", \"栖\", \"寝\", \"米\", \"暧\", \"破\", \"叶\", \"電\", \"谎\", \"停\", \"汁\", \"命\", \"楞\", \"嫉\", \"荆\", \"舎\", \"歩\", \"氨\", \"货\", \"立\", \"睡\", \"撸\", \"烦\", \"扑\", \"牢\", \"泊\", \"撞\", \"擎\", \"兑\", \"徒\", \"痫\", \"挲\", \"圣\", \"町\", \"瀚\", \"梵\", \"获\", \"难\", \"猎\", \"博\", \"卢\", \"探\", \"瞟\", \"匕\", \"孕\", \"奉\", \"漫\", \"井\", \"骄\", \"翁\", \"照\", \"罐\", \"呜\", \"莺\", \"绷\", \"单\", \"坐\", \"帆\", \"止\", \"辖\", \"极\", \"菇\", \"敦\", \"伺\", \"压\", \"谑\", \"参\", \"迫\", \"傍\", \"瓢\", \"堡\", \"纷\", \"尬\", \"哮\", \"凉\", \"屉\", \"遭\", \"凿\", \"漱\", \"吝\", \"闫\", \"来\", \"炳\", \"偏\", \"始\", \"妹\", \"強\", \"写\", \"番\", \"粼\", \"畔\", \"鹃\", \"干\", \"汤\", \"谣\", \"表\", \"庸\", \"兽\", \"瞅\", \"麽\", \"苍\", \"宪\", \"髻\", \"烊\", \"搂\", \"空\", \"赏\", \"蓟\", \"迭\", \"痪\", \"莱\", \"总\", \"透\", \"缭\", \"浴\", \"肿\", \"轩\", \"悠\", \"牖\", \"是\", \"霹\", \"浓\", \"暄\", \"枝\", \"屠\", \"祥\", \"弊\", \"肴\", \"恺\", \"过\", \"起\", \"首\", \"虾\", \"坟\", \"庶\", \"廉\", \"〗\", \"榄\", \"搡\", \"报\", \"诉\", \"拳\", \"噢\", \"派\", \"瘾\", \"肚\", \"控\", \"而\", \"水\", \"赂\", \"峨\", \"近\", \"走\", \"勾\", \"券\", \"抿\", \"绳\", \"衅\", \"揍\", \"播\", \"丽\", \"玫\", \"傥\", \"赡\", \"崽\", \"肃\", \"仑\", \"罕\", \"街\", \"虔\", \"擦\", \"汰\", \"斑\", \"婆\", \"袱\", \"明\", \"同\", \"棉\", \"富\", \"钜\", \"锢\", \"冀\", \"那\", \"逊\", \"午\", \"盲\", \"箍\", \"埃\", \"虎\", \"吹\", \"蓉\", \"愣\", \"\", \"琪\", \"栏\", \"蔼\", \"拣\", \"寞\", \"忐\", \"充\", \"i\", \"生\", \"腰\", \"厦\", \"棠\", \"讯\", \"杀\", \"股\", \"瘤\", \"熬\", \"右\", \"轿\", \"抡\", \"赤\", \"旨\", \"咐\", \"玳\", \"应\", \"阵\", \"他\", \"稳\", \"假\", \"孪\", \"玲\", \"军\", \"麦\", \"几\", \"隆\", \"银\", \"狂\", \"咳\", \"驮\", \"晚\", \"胰\", \"捍\", \"次\", \"张\", \"拽\", \"丈\", \"尹\", \"圈\", \"尉\", \"洪\", \"辆\", \"隘\", \"紧\", \"之\", \"托\", \"会\", \"殿\", \"缚\", \"葩\", \"团\", \"霍\", \"达\", \"瀑\", \"铸\", \"赠\", \"穆\", \"垣\", \"佛\", \"因\", \"康\", \"潭\", \"鸠\", \"价\", \"篝\", \"惰\", \"坏\", \"施\", \"曳\", \"遵\", \"用\", \"泻\", \"青\", \"燕\", \"琼\", \"刚\", \"掂\", \"涝\", \"只\", \"狡\", \"华\", \"擂\", \"杨\", \"艾\", \"惧\", \"剪\", \"吟\", \"制\", \"婶\", \"霭\", \"相\", \"织\", \"濮\", \"肥\", \"戒\", \"擞\", \"倏\", \"晓\", \"倒\", \"肩\", \"並\", \"伙\", \"粽\", \"疹\", \"对\", \"疑\", \"年\", \"禧\", \"樊\", \"裙\", \"滓\", \"可\", \"翱\", \"账\", \"批\", \"廷\", \"羊\", \"馆\", \"掀\", \"恳\", \"汐\", \"洽\", \"砌\", \"询\", \"卍\", \"寅\", \"妄\", \"甬\", \"骂\", \"码\", \"霊\", \"奸\", \"虑\", \"桐\", \"字\", \"骤\", \"仙\", \"凳\", \"襄\", \"领\", \"重\", \"燃\", \"赢\", \"驿\", \"瑰\", \"统\", \"粒\", \"炼\", \"匪\", \"益\", \"霸\", \"览\", \"壕\", \"三\", \"血\", \"政\", \"韦\", \"镕\", \"猾\", \"盖\", \"碧\", \"钢\", \"⒁\", \"摧\", \"斋\", \"剿\", \"遥\", \"氛\", \"有\", \"咽\", \"骏\", \"旧\", \"涉\", \"际\", \"倚\", \"欸\", \"填\", \"溅\", \"款\", \"胶\", \"牺\", \"涨\", \"鲜\", \"售\", \"聪\", \"俺\", \"馕\", \"嘀\", \"武\", \"冈\", \"咀\", \"跪\", \"册\", \"芃\", \"横\", \"割\", \"莫\", \"鹿\", \"伍\", \"犹\", \"孜\", \"疏\", \"\", \"铩\", \"钓\", \"欠\", \"系\", \"扔\", \"昊\", \"解\", \"呆\", \"俞\", \"劾\", \"戛\", \"释\", \"恐\", \"蹿\", \"鸡\", \"友\", \"巩\", \"饨\", \"竞\", \"鸿\", \"挺\", \"贸\", \"琴\", \"颗\", \"渠\", \"槐\", \"撼\", \"⑤\", \"组\", \"蕉\", \"霆\", \"动\", \"苏\", \"掠\", \"厚\", \"星\", \"缮\", \"脯\", \"抵\", \"慮\", \"茉\", \"シ\", \"潜\", \"模\", \"据\", \"淞\", \"拦\", \"胁\", \"崛\", \"吓\", \"犷\", \"现\", \"帝\", \"去\", \"主\", \"爹\", \"掘\", \"蛛\", \"奇\", \"伪\", \"蔑\", \"疮\", \"贫\", \"鄙\", \"犟\", \"诟\", \"莲\", \"噶\", \"骛\", \"窥\", \"祝\", \"〖\", \"娘\", \"寡\", \"蘑\", \"萤\", \"菱\", \"喇\", \"亥\", \"侬\", \"茸\", \"亨\", \"赌\", \"矩\", \"镐\", \"翡\", \"扣\", \"莘\", \"业\", \"烈\", \"零\", \"寇\", \"咱\", \"父\", \"雷\", \"馏\", \"渗\", \"蒿\", \"本\", \"丁\", \"酷\", \"懦\", \"捺\", \"周\", \"骇\", \"鹏\", \"混\", \"靴\", \"挎\", \"漂\", \"掏\", \"窄\", \"猫\", \"问\", \"海\", \"棺\", \"噱\", \"衷\", \"昏\", \"胃\", \"代\", \"企\", \"烃\", \"喧\", \"璀\", \"嵌\", \"侨\", \"罪\", \"陌\", \"核\", \"惶\", \"淆\", \"佰\", \"颉\", \"桶\", \"喱\", \"途\", \"谚\", \"胧\", \"嗜\", \"信\", \"漓\", \"申\", \"勘\", \"垠\", \"音\", \"借\", \"阳\", \"刊\", \"仰\", \"拉\", \"啬\", \"诃\", \"凰\", \"惑\", \"长\", \"狗\", \"纾\", \"鸦\", \"向\", \"後\", \"拒\", \"也\", \"否\", \"墓\", \"斜\", \"盏\", \"畴\", \"交\", \"披\", \"种\", \"定\", \"娥\", \"扎\", \"缀\", \"培\", \"逐\", \"森\", \"夭\", \"弩\", \"裹\", \"捐\", \"汝\", \"徨\", \"椎\", \"望\", \"液\", \"聊\", \"奠\", \"畿\", \"疸\", \"趋\", \"鼎\", \"拭\", \"溘\", \"咋\", \"浅\", \"熙\", \"狱\", \"葬\", \"和\", \"臂\", \"蟑\", \"韬\", \"肪\", \"蒜\", \"裆\", \"資\", \"熟\", \"沓\", \"引\", \"绑\", \"睬\", \"鼻\", \"卤\", \"吃\", \"锈\", \"喆\", \"最\", \"蹊\", \"俏\", \"湮\", \"才\", \"堵\", \"诺\", \"虏\", \"秦\", \"苒\", \"喊\", \"爵\", \"\\u0006\", \"運\", \"噼\", \"污\", \"缓\", \"舍\", \"碌\", \"求\", \"脸\", \"彗\", \"替\", \"诚\", \"嚎\", \"脖\", \"窍\", \"抽\", \"苟\", \"遁\", \"数\", \"产\", \"爪\", \"〉\", \"辞\", \"撷\", \"扇\", \"涤\", \"府\", \"福\", \"穹\", \"审\", \"拧\", \"趁\", \"沮\", \"英\", \"坠\", \"霖\", \"恿\", \"歇\", \"缆\", \"腺\", \"哟\", \"锡\", \"冉\", \"楠\", \"佣\", \"蜕\", \"怎\", \"嚣\", \"浆\", \"鹈\", \"瞥\", \"赅\", \"摄\", \"砖\", \"砧\", \"棋\", \"百\", \"振\", \"爱\", \"粗\", \"拘\", \"涡\", \"苗\", \"台\", \"榜\", \"太\", \"〕\", \"詹\", \"云\", \"匿\", \"橙\", \"扩\", \"瘦\", \"椭\", \"蚊\", \"化\", \"悦\", \"焦\", \"个\", \"油\", \"署\", \"兢\", \"悬\", \"琳\", \"叩\", \"吧\", \"师\", \"碰\", \"。\", \"驭\", \"婪\", \"肠\", \"瞪\", \"─\", \"廖\", \"汉\", \"力\", \"准\", \"隐\", \"劣\", \"塌\", \"陛\", \"郴\", \"珀\", \"沦\", \"绥\", \"梅\", \"吩\", \"锄\", \"蛙\", \"刘\", \"究\", \"绽\", \"绩\", \"峭\", \"士\", \"苣\", \"噴\", \"馍\", \"妙\", \"棚\", \"浊\", \"抒\", \"直\", \"逗\", \"呈\", \"鲍\", \"昂\", \"丘\", \"肓\", \"永\", \"亂\", \"辈\", \"掌\", \"收\", \"叹\", \"忌\", \"幸\", \"鹅\", \"隋\", \"稿\", \"洞\", \"磅\", \"爰\", \"夫\", \"稠\", \"芷\", \"卫\", \"唯\", \"藉\", \"蝗\", \"眩\", \"黝\", \"纵\", \"畸\", \"萎\", \"骆\", \"受\", \"咦\", \"惫\", \"怒\", \"感\", \"炭\", \"刀\", \"迪\", \"魁\", \"赎\", \"俄\", \"抱\", \"懒\", \"离\", \"容\", \"内\", \"镜\", \"凭\", \"醍\", \"〞\", \"式\", \"粕\", \"豪\", \"兜\", \"吁\", \"烁\", \"瑞\", \"枪\", \"子\", \"害\", \"葫\", \"炙\", \"坷\", \"务\", \"⑴\", \"偻\", \"]\", \"郭\", \"仲\", \"嘴\", \"闵\", \"挡\", \"两\", \"绪\", \"协\", \"柬\", \"祉\", \"闺\", \"芋\", \"侣\", \"综\", \"堂\", \"抓\", \"讳\", \"宁\", \"卡\", \"毙\", \"聿\", \"攻\", \"客\", \"遴\", \"章\", \"庙\", \"薰\", \"妍\", \"骑\", \"谛\", \"剔\", \"蜴\", \"己\", \"打\", \"疫\", \"处\", \"搁\", \"悴\", \"黩\", \"阱\", \"擀\", \"响\", \"瑟\", \"據\", \"判\", \"筹\", \"胞\", \"折\", \"鄂\", \"木\", \"慨\", \"栅\", \"阎\", \"⑩\", \"Ø\", \"僚\", \"榨\", \"闾\", \"阀\", \"宠\", \"狭\", \"偌\", \"蚁\", \"缠\", \"避\", \"枷\", \"奂\", \"存\", \"陶\", \"辣\", \"董\", \"隧\", \"愁\", \"形\", \"酿\", \"犬\", \"舐\", \"蜒\", \"殖\", \"京\", \"面\", \"歧\", \"柚\", \"汹\", \"复\", \"泌\", \"杉\", \"皇\", \"车\", \"惬\", \"爽\", \"愧\", \"描\", \"奔\", \"私\", \"泄\", \"梭\", \"發\", \"堪\", \"痛\", \"\\u0000\", \"瘀\", \"俑\", \"践\", \"遂\", \"赣\", \"些\", \"小\", \"杜\", \"粱\", \"鞭\", \"乔\", \"氯\", \"杯\", \"殊\", \"患\", \"买\", \"竭\", \"冠\", \"沽\", \"忽\", \"颤\", \"镀\", \"返\", \"挽\", \"乾\", \"旅\", \"钮\", \"褐\", \"蓝\", \"籁\", \"钰\", \"臧\", \"弄\", \"丑\", \"庆\", \"味\", \"扰\", \"浚\", \"毡\", \"牵\", \"刺\", \"稚\", \"淑\", \"鳞\", \"行\", \"宗\", \"舵\", \"翅\", \"醐\", \"冰\", \"焕\", \"缥\", \"痊\", \"默\", \"畏\", \"棕\", \"姗\", \"啃\", \"捉\", \"揪\", \"称\", \"倪\", \"阅\", \"找\", \"随\", \"媒\", \"妃\", \"故\", \"港\", \"今\", \"恼\", \"佘\", \"芥\", \"巨\", \"辽\", \"肺\", \"常\", \"瑧\", \"流\", \"陨\", \"燥\", \"熔\", \"歪\", \"逶\", \"匮\", \"疆\", \"靖\", \"舔\", \"劝\", \"又\", \"拙\", \"沉\", \"酱\", \"静\", \"滋\", \"鼯\", \"萌\", \"赁\", \"牛\", \"動\", \"懈\", \"宽\", \"寿\", \"⑨\", \"蕃\", \"焯\", \"6\", \"\", \"侈\", \"馅\", \"掳\", \"伦\", \"斥\", \"厝\", \"覆\", \"埂\", \"屿\", \"桦\", \"踵\", \"骼\", \"黑\", \"瘩\", \"卿\", \"鹰\", \"豆\", \"厌\", \"眯\", \"叉\", \"辩\", \"饥\", \"做\", \"撇\", \"毁\", \"嘱\", \"堆\", \"啤\", \"荟\", \"屎\", \"牙\", \"吏\", \"答\", \"高\", \"妖\", \"沛\", \"美\", \"鳌\", \"刨\", \"螃\", \"瓷\", \"址\", \"渍\", \"麓\", \"迅\", \"您\", \"淖\", \"哨\", \"地\", \"佩\", \"岭\", \"猛\", \"逮\", \"孱\", \"惭\", \"瞧\", \"堕\", \"珏\", \"鲱\", \"捆\", \"纺\", \"碴\", \"蓬\", \"咯\", \"坎\", \"棣\", \"绣\", \"網\", \"震\", \"著\", \"迩\", \"盹\", \"芝\", \"浦\", \"耗\", \"要\", \"缕\", \"还\", \"即\", \"抨\", \"蹭\", \"洗\", \"稻\", \"韩\", \"乍\", \"急\", \"镭\", \"夸\", \"吞\", \"跃\", \"彰\", \"氢\", \"塘\", \"觉\", \"祷\", \"纱\", \"斩\", \"汲\", \"厂\", \"奴\", \"季\", \"抄\", \"你\", \"步\", \"钦\", \"瑢\", \"淼\", \"灯\", \"已\", \"号\", \"胸\", \"瀛\", \"矢\", \"漠\", \"底\", \"痰\", \"为\", \"蔡\", \"性\", \"医\", \"辗\", \"簇\", \"肌\", \"淌\", \"羽\", \"渥\", \"厥\", \"惠\", \"墙\", \"译\", \"涯\", \"误\", \"传\", \"构\", \"廓\", \"勃\", \"邃\", \"邸\", \"在\", \"再\", \"限\", \"拔\", \"橡\", \"疴\", \"铁\", \"ノ\", \"粟\", \"淋\", \"阁\", \"觅\", \"垃\", \"莹\", \"家\", \"扮\", \"篇\", \"幽\", \"篢\", \"拨\", \"绚\", \"按\", \"叠\", \"彬\", \"踹\", \"缜\", \"缴\", \"渺\", \"椰\", \"為\", \"2\", \"庇\", \"巳\", \"叮\", \"寄\", \"者\", \"靓\", \"败\", \"糟\", \"看\", \"拌\", \"睛\", \"侍\", \"苇\", \"谨\", \"谁\", \"蹈\", \"崇\", \"坊\", \"萼\", \"北\", \"卸\", \"狈\", \"放\", \"熄\", \"泯\", \"必\", \"金\", \"纲\", \"件\", \"囊\", \"4\", \"蝇\", \"損\", \"⑥\", \"航\", \"良\", \"\", \"秘\", \"別\", \"潇\", \"魄\", \"醉\", \"幕\", \"棂\", \"卻\", \"聆\", \"寓\", \"猥\", \"穿\", \"拯\", \"茧\", \"翔\", \"摒\", \"壮\", \"璨\", \"融\", \"某\", \"盛\", \"归\", \"窿\", \"谭\", \"滑\", \"衍\", \"卧\", \"案\", \"愕\", \"辉\", \"ό\", \"哦\", \"回\", \"躁\", \"夥\", \"溺\", \"灭\", \"翕\", \"波\", \"舌\", \"维\", \"溪\", \"率\", \"耳\", \"莅\", \"狐\", \"慢\", \"聂\", \"鞠\", \"毛\", \"孟\", \"乘\", \"罗\", \"了\", \"霞\", \"邋\", \"皑\", \"劈\", \"腾\", \"趣\", \"咔\", \"~\", \"亟\", \"摹\", \"鞍\", \"月\", \"玉\", \"们\", \"挥\", \"简\", \"坑\", \"摆\", \"禅\", \"决\", \"殉\", \"乳\", \"阿\", \"红\", \"材\", \"凸\", \"忪\", \"却\", \"深\", \"齿\", \"缸\", \"鼓\", \"冤\", \"庞\", \"媚\", \"》\", \"飚\", \"畅\", \"胱\", \"洋\", \"槿\", \"叫\", \"遮\", \"蹄\", \"墟\", \"碎\", \"告\", \"蕤\", \"俩\", \"境\", \"晾\", \"虱\", \"身\", \"悉\", \"帖\", \"尔\", \"?\", \"援\", \"悯\", \"违\", \"畜\", \"题\", \"呕\", \"旋\", \"绰\", \"橱\", \"匙\", \"陀\", \"瓜\", \"澈\", \"喻\", \"挚\", \"划\", \"揭\", \"怖\", \"鹉\", \"舒\", \"侯\", \"皆\", \"婊\", \"须\", \"坤\", \"虹\", \"麟\", \"甩\", \"睿\", \"坦\", \"羚\", \"叨\", \"凋\", \"颇\", \"宛\", \"娅\", \"钝\", \"瑄\", \"但\", \"廊\", \"呸\", \"斐\", \"遣\", \"⑧\", \"玄\", \"琦\", \"慰\", \"篓\", \"源\", \"佟\", \"较\", \"校\", \"尚\", \"a\", \"岐\", \"岩\", \"盗\", \"挂\", \"峙\", \"ς\", \"般\", \"涎\", \"提\", \"催\", \"剖\", \"翘\", \"傲\", \"树\", \"置\", \"岸\", \"栓\", \"费\", \"碑\", \"颂\", \"跋\", \"烤\", \"外\", \"予\", \"轼\", \"郝\", \"辟\", \"熨\", \"钥\", \"《\", \"部\", \"鸭\", \"~\", \"饽\", \"疼\", \"完\", \"扫\", \"持\", \"递\", \"上\", \"硕\", \"秀\", \"②\", \"炊\", \"寰\", \"镏\", \"场\", \"∶\", \"炖\", \"质\", \"梨\", \"\\b\", \"候\", \"眠\", \"倜\", \"挪\", \"r\", \"戴\", \"历\", \"州\", \"乙\", \"及\", \"愤\", \"秩\", \"煮\", \"菊\", \"筝\", \"⒋\", \"岱\", \"宣\", \"赫\", \"湛\", \"浙\", \"瓶\", \"啊\", \"涮\", \"谬\", \"棍\", \"犁\", \"仓\", \"舶\", \"队\", \"巫\", \"念\", \"蟋\", \"垢\", \"柯\", \"袒\", \"许\", \"忘\", \"橇\", \"焚\", \"集\", \"抉\", \"迎\", \"掬\", \"敏\", \"恣\", \"砺\", \"阶\", \"蚪\", \"宅\", \"雅\", \"谓\", \"蔬\", \"剁\", \"设\", \"俪\", \"』\", \"鳃\", \"阽\", \"微\", \"仇\", \"懊\", \"時\", \"螺\", \"於\"]",
"reversible": false
},
"openai-community/gpt2 @ cc100/en": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1124813,
"_n_tokens": 258428,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai-community/gpt2 @ cc100/zh-Hans": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"openai/code-davinci-002 @ cc100/en": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1124813,
"_n_tokens": 258403,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/zh-Hans": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/en": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/zh-Hans": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/en": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/zh-Hans": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/en": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1124813,
"_n_tokens": 251655,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/zh-Hans": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2633047,
"_n_tokens": 707171,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/en": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1124813,
"_n_tokens": 258403,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/zh-Hans": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/ar": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1795801,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/de": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 698366,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/en": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 270400,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/es": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 577018,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/fa": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1337264,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/fr": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 533106,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/ja": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 740791,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/ko": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1203134,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-34B @ cc100/zh-Hans": {
"tokenizer": "Yi-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 588729,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/ar": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1795801,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/de": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 698366,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/en": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 270400,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/es": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 577018,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/fa": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1337264,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/fr": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 533106,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/ja": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 740791,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/ko": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1203134,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-6B @ cc100/zh-Hans": {
"tokenizer": "Yi-6B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 588729,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/ar": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1803957,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/de": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 697065,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/en": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 269738,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/es": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 576794,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/fa": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1346819,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/fr": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 532288,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/ja": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 749927,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/ko": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 1210021,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"01-ai/Yi-VL-34B @ cc100/zh-Hans": {
"tokenizer": "Yi-VL-34B",
"organization": "Yi",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 596166,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ClassCat/gpt2-base-french @ cc100/ar": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2813283,
"_n_tokens": 1362808,
"_n_chars": 1560987,
"_n_oov_chars": 1895,
"oov_ratio": 0.001213975516772401,
"_oov_charset": "[\"V\", \"U\", \"I\", \"S\", \"ﻻ\", \"N\", \"T\", \"W\", \"G\", \"ﷺ\", \"ﻷ\", \"Y\", \"…\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Х\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"″\", \"½\", \"Z\", \"ﻹ\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/de": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1814876,
"_n_tokens": 598773,
"_n_chars": 1784021,
"_n_oov_chars": 90272,
"oov_ratio": 0.05060030122963799,
"_oov_charset": "[\"V\", \"u\", \"U\", \"İ\", \"I\", \"É\", \"Á\", \"S\", \" \", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"¼\", \"²\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"Ø\", \"B\", \"P\", \"Ã\", \"Q\", \"Ü\", \"Ö\", \"X\", \"H\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"¹\", \"™\", \"½\", \"Z\", \"´\", \"O\", \"̈\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/en": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1124813,
"_n_tokens": 319127,
"_n_chars": 1121360,
"_n_oov_chars": 31089,
"oov_ratio": 0.02772437040736249,
"_oov_charset": "[\"V\", \"U\", \"I\", \"③\", \"S\", \"⑧\", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"M\", \"⑦\", \"A\", \"D\", \"K\", \"J\", \"L\", \"‑\", \"R\", \"P\", \"B\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"⑤\", \"⑩\", \"Z\", \"´\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/es": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1664455,
"_n_tokens": 529060,
"_n_chars": 1630297,
"_n_oov_chars": 40703,
"oov_ratio": 0.02496661651220606,
"_oov_charset": "[\"М\", \"V\", \"U\", \"I\", \"É\", \"Á\", \"S\", \"N\", \"T\", \"W\", \"G\", \"Y\", \"…\", \"²\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Í\", \"Q\", \"X\", \"º\", \"H\", \"ª\", \"F\", \"C\", \"Ñ\", \"″\", \"Ú\", \"´\", \"Z\", \"O\", \"Ó\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/fa": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2054052,
"_n_tokens": 1093333,
"_n_chars": 1145876,
"_n_oov_chars": 1473,
"oov_ratio": 0.0012854794061486583,
"_oov_charset": "[\"V\", \"U\", \"I\", \" \", \"S\", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"ﮧ\", \"Z\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/fr": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1540504,
"_n_tokens": 341687,
"_n_chars": 1484970,
"_n_oov_chars": 28793,
"oov_ratio": 0.019389617298665965,
"_oov_charset": "[\"V\", \"U\", \"I\", \"É\", \"̂\", \"S\", \"N\", \"T\", \"W\", \"G\", \"Â\", \"Y\", \"…\", \"Î\", \"²\", \"M\", \"A\", \"À\", \"D\", \"K\", \"J\", \"℃\", \"L\", \"́\", \"µ\", \"̧\", \"R\", \"B\", \"P\", \"Q\", \"Ê\", \"X\", \"H\", \"F\", \"C\", \"Ô\", \"″\", \"™\", \"È\", \"Z\", \"´\", \"O\", \"Ç\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/ja": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1774770,
"_n_tokens": 1149553,
"_n_chars": 603065,
"_n_oov_chars": 10443,
"oov_ratio": 0.017316541334682,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"つ\", \"*\", \"N\", \"9\", \"G\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"M\", \"L\", \"D\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"④\", \"し\", \"~\", \"X\", \"I\", \"H\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"I\", \"-\", \"V\", \"4\", \"て\", \"Z\", \"…\", \"¥\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"R\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"コ\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"F\", \"C\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ホ\", \"ウ\", \"E\", \"r\", \"せ\", \"3\", \"U\", \"゚\", \"す\", \"H\", \"S\", \"U\", \"W\", \"T\", \"+\", \"ヨ\", \"\\", \"Y\", \"e\", \"A\", \"8\", \"Y\", \"K\", \"L\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"\\b\", \"㎞\", \"「\", \"Q\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"ス\", \"B\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \"O\", \"T\", \"l\", \":\", \"V\", \"0\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"゚\", \"ひ\", \"[\", \"J\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"B\", \"P\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"Д\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"Z\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/ko": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1524839,
"_n_tokens": 1411369,
"_n_chars": 655190,
"_n_oov_chars": 10124,
"oov_ratio": 0.015452006288252263,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"N\", \"*\", \"G\", \"ㄷ\", \"@\", \"M\", \"ㅜ\", \"D\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"④\", \"X\", \"․\", \"H\", \"ㅝ\", \"Ⅱ\", \"ㄹ\", \"Ⅶ\", \"㏊\", \"Ⅵ\", \"I\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"①\", \"R\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"F\", \"C\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"②\", \"⑸\", \"E\", \"U\", \"ⓔ\", \"㉠\", \"ㄱ\", \"S\", \"ㆍ\", \"ㅢ\", \"W\", \"T\", \"ㅈ\", \"㎡\", \"ㅋ\", \"ㅑ\", \"Y\", \"梁\", \"A\", \"⑨\", \"K\", \"ㅓ\", \"L\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"Q\", \"ㅚ\", \"‥\", \" \", \"樂\", \"流\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"ㅆ\", \"O\", \"ㅘ\", \":\", \"⑹\", \"V\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"⑦\", \"ⅱ\", \"J\", \"ⅰ\", \"ㅞ\", \"累\", \"⑵\", \"P\", \"B\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"ㅎ\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"Z\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"?\"]",
"reversible": false
},
"ClassCat/gpt2-base-french @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-french",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2633047,
"_n_tokens": 1921438,
"_n_chars": 927311,
"_n_oov_chars": 74048,
"oov_ratio": 0.07985239040623912,
"_oov_charset": "[\"a\", \" \", \"]\", \"③\", \"\", \"5\", \"n\", \" \", \"N\", \"9\", \"G\", \"⒀\", \"C\", \"M\", \"?\", \"D\", \"Ø\", \".\", \"~\", \"X\", \"H\", \"⑩\", \"p\", \"t\", \"I\", \"⑶\", \"-\", \"V\", \"4\", \"…\", \"℃\", \"①\", \"R\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"\", \"7\", \"\", \",\", \"F\", \"C\", \"h\", \"・\", \"②\", \"⑸\", \"\", \"E\", \"r\", \"3\", \"U\", \"\\u0000\", \"S\", \"W\", \"T\", \"+\", \"⒂\", \"Y\", \"e\", \"A\", \"8\", \"⑨\", \"K\", \"L\", \"\\u0005\", \"&\", \"A\", \"\", \"\\b\", \"⑿\", \"Q\", \"\\u0006\", \"_\", \"2\", \" \", \"⑤\", \"\", \"O\", \"T\", \":\", \"V\", \"0\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \"⒃\", \"⑦\", \"[\", \"J\", \"i\", \"P\", \"B\", \"⒋\", \"!\", \")\", \"6\", \""\", \";\", \"1\", \"\\u0007\", \"(\", \"s\", \"Z\", \"N\", \"④\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/ar": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2813283,
"_n_tokens": 1414504,
"_n_chars": 1560987,
"_n_oov_chars": 1895,
"oov_ratio": 0.001213975516772401,
"_oov_charset": "[\"V\", \"U\", \"I\", \"S\", \"ﻻ\", \"N\", \"T\", \"W\", \"G\", \"ﷺ\", \"ﻷ\", \"Y\", \"…\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Х\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"″\", \"½\", \"Z\", \"ﻹ\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/de": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1814876,
"_n_tokens": 623279,
"_n_chars": 1784021,
"_n_oov_chars": 90272,
"oov_ratio": 0.05060030122963799,
"_oov_charset": "[\"V\", \"u\", \"U\", \"İ\", \"I\", \"É\", \"Á\", \"S\", \" \", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"¼\", \"²\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"Ø\", \"B\", \"P\", \"Ã\", \"Q\", \"Ü\", \"Ö\", \"X\", \"H\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"¹\", \"™\", \"½\", \"Z\", \"´\", \"O\", \"̈\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/en": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1124813,
"_n_tokens": 322348,
"_n_chars": 1121360,
"_n_oov_chars": 31089,
"oov_ratio": 0.02772437040736249,
"_oov_charset": "[\"V\", \"U\", \"I\", \"③\", \"S\", \"⑧\", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"M\", \"⑦\", \"A\", \"D\", \"K\", \"J\", \"L\", \"‑\", \"R\", \"P\", \"B\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"⑤\", \"⑩\", \"Z\", \"´\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/es": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1664455,
"_n_tokens": 340022,
"_n_chars": 1630297,
"_n_oov_chars": 40703,
"oov_ratio": 0.02496661651220606,
"_oov_charset": "[\"М\", \"V\", \"U\", \"I\", \"É\", \"Á\", \"S\", \"N\", \"T\", \"W\", \"G\", \"Y\", \"…\", \"²\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Í\", \"Q\", \"X\", \"º\", \"H\", \"ª\", \"F\", \"C\", \"Ñ\", \"″\", \"Ú\", \"´\", \"Z\", \"O\", \"Ó\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/fa": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2054052,
"_n_tokens": 1119673,
"_n_chars": 1145876,
"_n_oov_chars": 1473,
"oov_ratio": 0.0012854794061486583,
"_oov_charset": "[\"V\", \"U\", \"I\", \" \", \"S\", \"W\", \"T\", \"N\", \"G\", \"Y\", \"…\", \"M\", \"A\", \"D\", \"K\", \"J\", \"L\", \"R\", \"B\", \"P\", \"Q\", \"X\", \"H\", \"F\", \"C\", \"ﮧ\", \"Z\", \"O\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/fr": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1540504,
"_n_tokens": 500750,
"_n_chars": 1484970,
"_n_oov_chars": 28793,
"oov_ratio": 0.019389617298665965,
"_oov_charset": "[\"V\", \"U\", \"I\", \"É\", \"̂\", \"S\", \"N\", \"T\", \"W\", \"G\", \"Â\", \"Y\", \"…\", \"Î\", \"²\", \"M\", \"A\", \"À\", \"D\", \"K\", \"J\", \"℃\", \"L\", \"́\", \"µ\", \"̧\", \"R\", \"B\", \"P\", \"Q\", \"Ê\", \"X\", \"H\", \"F\", \"C\", \"Ô\", \"″\", \"™\", \"È\", \"Z\", \"´\", \"O\", \"Ç\", \"E\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/ja": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1774770,
"_n_tokens": 1191203,
"_n_chars": 603065,
"_n_oov_chars": 10443,
"oov_ratio": 0.017316541334682,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"つ\", \"*\", \"N\", \"9\", \"G\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"M\", \"L\", \"D\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"④\", \"し\", \"~\", \"X\", \"I\", \"H\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"I\", \"-\", \"V\", \"4\", \"て\", \"Z\", \"…\", \"¥\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"R\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"コ\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"F\", \"C\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ホ\", \"ウ\", \"E\", \"r\", \"せ\", \"3\", \"U\", \"゚\", \"す\", \"H\", \"S\", \"U\", \"W\", \"T\", \"+\", \"ヨ\", \"\\", \"Y\", \"e\", \"A\", \"8\", \"Y\", \"K\", \"L\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"\\b\", \"㎞\", \"「\", \"Q\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"ス\", \"B\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \"O\", \"T\", \"l\", \":\", \"V\", \"0\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"゚\", \"ひ\", \"[\", \"J\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"B\", \"P\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"Д\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"Z\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/ko": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 1524839,
"_n_tokens": 1377796,
"_n_chars": 655190,
"_n_oov_chars": 10124,
"oov_ratio": 0.015452006288252263,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"N\", \"*\", \"G\", \"ㄷ\", \"@\", \"M\", \"ㅜ\", \"D\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"④\", \"X\", \"․\", \"H\", \"ㅝ\", \"Ⅱ\", \"ㄹ\", \"Ⅶ\", \"㏊\", \"Ⅵ\", \"I\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"①\", \"R\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"F\", \"C\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"②\", \"⑸\", \"E\", \"U\", \"ⓔ\", \"㉠\", \"ㄱ\", \"S\", \"ㆍ\", \"ㅢ\", \"W\", \"T\", \"ㅈ\", \"㎡\", \"ㅋ\", \"ㅑ\", \"Y\", \"梁\", \"A\", \"⑨\", \"K\", \"ㅓ\", \"L\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"Q\", \"ㅚ\", \"‥\", \" \", \"樂\", \"流\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"ㅆ\", \"O\", \"ㅘ\", \":\", \"⑹\", \"V\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"⑦\", \"ⅱ\", \"J\", \"ⅰ\", \"ㅞ\", \"累\", \"⑵\", \"P\", \"B\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"ㅎ\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"Z\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"?\"]",
"reversible": false
},
"ClassCat/gpt2-base-spanish @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-spanish",
"organization": "ClassCat",
"vocab_size": 50000,
"_n_bytes": 2633047,
"_n_tokens": 1978056,
"_n_chars": 927311,
"_n_oov_chars": 74048,
"oov_ratio": 0.07985239040623912,
"_oov_charset": "[\"a\", \" \", \"]\", \"③\", \"\", \"5\", \"n\", \" \", \"N\", \"9\", \"G\", \"⒀\", \"C\", \"M\", \"?\", \"D\", \"Ø\", \".\", \"~\", \"X\", \"H\", \"⑩\", \"p\", \"t\", \"I\", \"⑶\", \"-\", \"V\", \"4\", \"…\", \"℃\", \"①\", \"R\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"\", \"7\", \"\", \",\", \"F\", \"C\", \"h\", \"・\", \"②\", \"⑸\", \"\", \"E\", \"r\", \"3\", \"U\", \"\\u0000\", \"S\", \"W\", \"T\", \"+\", \"⒂\", \"Y\", \"e\", \"A\", \"8\", \"⑨\", \"K\", \"L\", \"\\u0005\", \"&\", \"A\", \"\", \"\\b\", \"⑿\", \"Q\", \"\\u0006\", \"_\", \"2\", \" \", \"⑤\", \"\", \"O\", \"T\", \":\", \"V\", \"0\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \"⒃\", \"⑦\", \"[\", \"J\", \"i\", \"P\", \"B\", \"⒋\", \"!\", \")\", \"6\", \""\", \";\", \"1\", \"\\u0007\", \"(\", \"s\", \"Z\", \"N\", \"④\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ar": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2813283,
"_n_tokens": 996313,
"_n_chars": 1560987,
"_n_oov_chars": 928499,
"oov_ratio": 0.5948153315818774,
"_oov_charset": "[\"م\", \"©\", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"ذ\", \"😀\", \"خ\", \"ۤ\", \"د\", \"۰\", \"٨\", \"▫\", \"\", \"٦\", \"
\", \"ْ\", \"ٌ\", \"😊\", \"ج\", \"█\", \"¡\", \"‹\", \"\", \"…\", \"ن\", \"♥\", \"χ\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"ۖ\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"١\", \"و\", \"\", \"Х\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"٥\", \"ﻹ\", \"ـ\", \"«\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"٤\", \"ء\", \"ή\", \"″\", \"ص\", \"ّ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/de": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1814876,
"_n_tokens": 960463,
"_n_chars": 1784021,
"_n_oov_chars": 5170,
"oov_ratio": 0.002897947950164264,
"_oov_charset": "[\"©\", \"€\", \"u\", \"¶\", \"ớ\", \"↩\", \"İ\", \"ς\", \"§\", \"😂\", \"\", \"‹\", \"č\", \"\", \"Á\", \"➔\", \"£\", \" \", \"¿\", \"ι\", \"ô\", \"ć\", \"☺\", \"…\", \"¼\", \"²\", \"♥\", \"\", \"😃\", \"\", \"¬\", \"¤\", \"â\", \"😈\", \"œ\", \"Ø\", \"š\", \"❤\", \"‚\", \"😀\", \"Ã\", \"ė\", \"›\", \"😦\", \"🙄\", \"Ö\", \"Ü\", \"‽\", \"😉\", \"„\", \"ï\", \"ư\", \"🙁\", \"‐\", \"û\", \"😆\", \"\", \"Ÿ\", \"Ä\", \"ø\", \"ß\", \"¹\", \"™\", \"\", \"å\", \"ń\", \"½\", \"�\", \"😢\", \"´\", \"ί\", \"«\", \"̈\", \"♦\", \"🙂\", \"♡\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/en": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1124813,
"_n_tokens": 526033,
"_n_chars": 1121360,
"_n_oov_chars": 141,
"oov_ratio": 0.00012574017264749946,
"_oov_charset": "[\"③\", \"¡\", \"£\", \"⑧\", \"¦\", \"\", \"…\", \"⑦\", \"‑\", \"😉\", \"ï\", \"😥\", \"\", \"⑤\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"´\", \"\", \"«\", \"🙂\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/es": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1664455,
"_n_tokens": 879530,
"_n_chars": 1630297,
"_n_oov_chars": 3885,
"oov_ratio": 0.002383001379503244,
"_oov_charset": "[\"✓\", \"©\", \"€\", \"¡\", \"ý\", \"Á\", \"\", \"¿\", \"️\", \"ô\", \"…\", \"²\", \"▷\", \"😀\", \"❤\", \"Í\", \"\", \"😦\", \"😉\", \"🙁\", \"👍\", \"º\", \"ª\", \"\", \"ø\", \"ñ\", \"Ñ\", \"✪\", \"″\", \"✔\", \"\", \"Ú\", \"👏\", \"´\", \"«\", \"Ó\", \"🙂\", \"✖\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/fa": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2054052,
"_n_tokens": 730377,
"_n_chars": 1145876,
"_n_oov_chars": 744234,
"oov_ratio": 0.6494891244776921,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"د\", \"۰\", \"٨\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"چ\", \"ة\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"�\", \"ظ\", \"ح\", \"ت\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"\", \"❤\", \"ڪ\", \"›\", \"؛\", \"ב\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"٥\", \"٫\", \"ـ\", \"«\", \"ٍ\", \"ش\", \"س\", \"۷\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"ء\", \"گ\", \"۴\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/fr": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1540504,
"_n_tokens": 812012,
"_n_chars": 1484970,
"_n_oov_chars": 5502,
"oov_ratio": 0.0037051253560677995,
"_oov_charset": "[\"€\", \"§\", \"♠\", \"Â\", \"Î\", \"…\", \"²\", \"À\", \"â\", \"̧\", \"℃\", \"ğ\", \"́\", \"µ\", \"œ\", \"❤\", \"😀\", \"ë\", \"î\", \"😉\", \"ã\", \"Ê\", \"ï\", \"‐\", \"û\", \"🤔\", \"♕\", \"\", \"«\", \"Ô\", \"ê\", \"″\", \"
\", \"™\", \"È\", \"�\", \"´\", \"ô\", \"̂\", \"Ç\", \"🙂\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ja": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1774770,
"_n_tokens": 565505,
"_n_chars": 603065,
"_n_oov_chars": 26633,
"oov_ratio": 0.044162735360201634,
"_oov_charset": "[\"a\", \"増\", \"ー\", \"濫\", \"③\", \"蛍\", \"嶽\", \"綜\", \"監\", \"9\", \"瀬\", \"慄\", \"f\", \"C\", \"釘\", \"針\", \"∀\", \"紐\", \"✨\", \"ぃ\", \"諸\", \"腫\", \"嘗\", \"載\", \"須\", \"ハ\", \"塗\", \"飽\", \"膚\", \"庁\", \".\", \"綾\", \"彿\", \"絡\", \"ヲ\", \"僕\", \"妬\", \"囲\", \"I\", \"穫\", \"鉢\", \"欝\", \"噴\", \"悩\", \"絞\", \"損\", \"騰\", \"聖\", \"⑩\", \"K\", \"貿\", \"貰\", \"両\", \"蓮\", \"競\", \"誠\", \"ぅ\", \"t\", \"嘆\", \"R\", \"喩\", \"腎\", \"嗚\", \"筈\", \"壊\", \"勝\", \"乗\", \"撫\", \"罰\", \"讃\", \"稲\", \"糞\", \"凪\", \"傾\", \"…\", \"徴\", \"¥\", \"澪\", \"夢\", \"🌙\", \"衝\", \"誘\", \"d\", \"縮\", \"遺\", \"協\", \"婦\", \"暦\", \"鑑\", \"G\", \"F\", \"駆\", \"緩\", \">\", \"箋\", \"謳\", \"暁\", \"ロ\", \"円\", \"靄\", \"債\", \"帰\", \"検\", \"・\", \"②\", \"犠\", \"ぉ\", \"糾\", \"獲\", \"雲\", \"呂\", \"財\", \"゚\", \"燭\", \"鎮\", \"項\", \"銃\", \"閣\", \"暢\", \"轢\", \"穢\", \"穏\", \"紙\", \"抜\", \"晩\", \"\\", \"揚\", \"毎\", \"薦\", \"و\", \"涙\", \"擁\", \"鍋\", \"桟\", \"働\", \"暫\", \"揮\", \"鳴\", \"ヵ\", \"梶\", \"&\", \"偉\", \"輩\", \"駄\", \"韮\", \"陳\", \"詠\", \"圏\", \"淵\", \"「\", \"ヘ\", \"ゝ\", \"丿\", \"館\", \"コ\", \"謗\", \"渓\", \"誌\", \"鉄\", \"診\", \"猟\", \"帳\", \"臨\", \"粧\", \"瘍\", \"岡\", \"´\", \"ぽ\", \"緑\", \"«\", \"鋲\", \"労\", \"礎\", \"測\", \"瘻\", \"槍\", \"頻\", \"違\", \"0\", \"嵐\", \"儀\", \"%\", \"貨\", \"縄\", \"|\", \"揃\", \"/\", \"躊\", \"慣\", \"審\", \"氷\", \"訳\", \"侶\", \"S\", \"゚\", \"[\", \"礫\", \"勲\", \"寛\", \"億\", \"ぬ\", \"b\", \"獣\", \"臥\", \"訝\", \"闘\", \"恵\", \"広\", \"X\", \"綴\", \"喪\", \"陣\", \"紹\", \"週\", \"佇\", \"轄\", \"敗\", \"輪\", \"躾\", \"騒\", \"賃\", \"棟\", \"貪\", \"丼\", \"痺\", \"豊\", \"♪\", \"✧\", \"賛\", \"舎\", \"預\", \"歓\", \"顔\", \"④\", \"鶴\", \"]\", \"賭\", \"霊\", \"袴\", \"郷\", \"鮮\", \"兎\", \"蠍\", \"彡\", \"鴻\", \"閉\", \"爾\", \"ㅂ\", \"鳥\", \"涼\", \"蒔\", \"ぞ\", \"酔\", \"姦\", \"軒\", \"M\", \"転\", \"織\", \"訊\", \"倫\", \"陽\", \"貫\", \"貧\", \"養\", \"談\", \"険\", \"辿\", \"錠\", \"桜\", \"錬\", \"捩\", \"彫\", \"篠\", \"貼\", \"孫\", \"扱\", \"粋\", \"鬱\", \"緻\", \"悶\", \"課\", \"懇\", \"餌\", \"-\", \"児\", \"戯\", \"墜\", \"4\", \"Z\", \"衆\", \"窓\", \"諺\", \"仏\", \"纒\", \"ゾ\", \"誹\", \"冊\", \"艸\", \"℃\", \"呟\", \"絆\", \"①\", \"ぼ\", \"▷\", \"殻\", \"罠\", \"緒\", \"庫\", \"D\", \"\", \"漬\", \"ゥ\", \"択\", \"7\", \"劉\", \"逡\", \"謡\", \"娯\", \"h\", \"�\", \"呑\", \"払\", \"剣\", \"∇\", \"P\", \"=\", \"篤\", \"聾\", \"♡\", \"撲\", \"訓\", \"賊\", \"銘\", \"誤\", \"遡\", \"挿\", \"訟\", \"飼\", \"閃\", \"諾\", \"図\", \"済\", \"⇔\", \"唸\", \"隕\", \"剤\", \"嘩\", \"圧\", \"捲\", \"詰\", \"鏡\", \"奪\", \"聴\", \"編\", \"羨\", \"馳\", \"鉛\", \"顎\", \"⻑\", \"\\b\", \"砕\", \"畳\", \"💦\", \"闊\", \"潰\", \"馴\", \"_\", \"訂\", \"麗\", \"掴\", \"濃\", \"樹\", \"詫\", \"誕\", \"ゥ\", \"😢\", \"゙\", \"⌒\", \"鋭\", \"賢\", \"T\", \"隠\", \"績\", \"綺\", \"艶\", \"梱\", \"w\", \"慶\", \"飲\", \"採\", \"趨\", \"俵\", \"訪\", \"惣\", \"衛\", \"詈\", \"雰\", \"駒\", \"併\", \"滅\", \"棄\", \"斂\", \"`\", \"捜\", \"順\", \"灘\", \"虜\", \"従\", \"ぇ\", \"♫\", \"^\", \"恥\", \"闖\", \"謀\", \"巣\", \";\", \"Д\", \"憂\", \"橋\", \"懸\", \"僅\", \"ぁ\", \"鎌\", \"贅\", \"戻\", \"雑\", \"ノ\", \"薬\", \"ウ\", \"艦\", \"N\", \"歴\", \"y\", \"纏\", \"©\", \"療\", \"紋\", \"醤\", \"5\", \"譜\", \"n\", \"脳\", \"憲\", \"懐\", \"*\", \"農\", \"軽\", \"貴\", \"饉\", \"L\", \"絶\", \"積\", \"湧\", \"鵜\", \"貸\", \"産\", \"譚\", \"脇\", \"軸\", \"陥\", \"Q\", \"緯\", \"๑\", \"ぴ\", \"渦\", \"備\", \"弾\", \"奨\", \"\", \"縦\", \"腸\", \"嚥\", \"紗\", \"謂\", \"側\", \"ゞ\", \"繊\", \"飾\", \"頂\", \"慮\", \"駕\", \"宮\", \"髭\", \"郵\", \"災\", \"鎖\", \"カ\", \"欄\", \"顕\", \"g\", \"<\", \"誇\", \"匂\", \"😊\", \"醸\", \"⇒\", \"曇\", \"鐘\", \"V\", \"ヌ\", \"麺\", \"冨\", \"龍\", \"蝋\", \"塚\", \"駅\", \"彙\", \"⑪\", \"職\", \"墾\", \"輸\", \"o\", \"欽\", \"喰\", \"醜\", \"絵\", \"憶\", \"団\", \"売\", \"曖\", \"◯\", \"鈴\", \"贈\", \"憤\", \"讐\", \",\", \"鱈\", \"渋\", \"潔\", \"頷\", \"壌\", \"O\", \"拡\", \"E\", \"純\", \"墳\", \"謙\", \"Ⅹ\", \"島\", \"贔\", \"鶏\", \"斎\", \"ぷ\", \"̈\", \"終\", \"営\", \"躍\", \"舗\", \"3\", \"償\", \"勧\", \"倉\", \"H\", \"噛\", \"綱\", \"塊\", \"峠\", \"縫\", \"渉\", \"喚\", \"異\", \"ぜ\", \"鞄\", \"締\", \"e\", \"捗\", \"領\", \"幣\", \"負\", \"歩\", \"銀\", \"焼\", \"‼\", \"㎞\", \"頑\", \"構\", \"舘\", \"膿\", \"複\", \"J\", \"潤\", \"縁\", \"縞\", \"\", \"擬\", \"堅\", \"拠\", \"̀\", \"栃\", \"辺\", \"傘\", \"麹\", \"詮\", \"餃\", \"飴\", \"脈\", \"l\", \":\", \"汎\", \"諦\", \"ィ\", \"拝\", \"〝\", \"贋\", \"氾\", \"猶\", \"額\", \"噂\", \"屓\", \"リ\", \"掲\", \"齢\", \"〟\", \"歯\", \"覇\", \" ̄\", \"貢\", \"熱\", \"貶\", \"鍛\", \"!\", \"唄\", \"責\", \"覗\", \"剰\", \"渕\", \"遅\", \"飛\", \"費\", \"″\", \"(\", \"韓\", \"s\", \"荘\", \"ヘ\", \"、\", \"蓋\", \"?\", \"繰\", \"塩\", \"詐\", \"罵\", \"餓\", \"敵\", \" \", \"頃\", \"遜\", \"飢\", \"ア\", \"髪\", \"W\", \"@\", \"漁\", \"啓\", \"範\", \"繍\", \"〆\", \"窪\", \"層\", \"貯\", \"脅\", \"処\", \"懲\", \"フ\", \"捨\", \"釣\", \"験\", \"値\", \"満\", \"覚\", \"゙\", \"権\", \"込\", \"紀\", \"摯\", \"勢\", \"賠\", \"軋\", \"掛\", \"癒\", \"儲\", \"湯\", \"飯\", \"駿\", \"訴\", \"謎\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"餅\", \"納\", \"滝\", \"輿\", \"駐\", \"築\", \"楊\", \"浄\", \"繋\", \"漑\", \"貝\", \"磯\", \"詳\", \"観\", \"輝\", \"彌\", \"汚\", \"環\", \"賀\", \"渇\", \"嬢\", \"頓\", \"ゎ\", \"適\", \"掃\", \"ヶ\", \"跡\", \"騙\", \"穂\", \"︎\", \"綻\", \"閲\", \"斉\", \"煙\", \"廃\", \"澤\", \"紡\", \"絨\", \"銭\", \"‐\", \"聞\", \"﨑\", \"m\", \"\\u001b\", \"沖\", \"換\", \"襲\", \"階\", \"専\", \"奮\", \"謬\", \"廻\", \"鉱\", \"洩\", \"😌\", \"獄\", \"窮\", \"偽\", \"黙\", \"紛\", \"綬\", \"穀\", \"縛\", \"軟\", \"簗\", \"r\", \"拶\", \"ゼ\", \"頼\", \"託\", \"顧\", \"塵\", \"殺\", \"U\", \"鈍\", \"驚\", \"軌\", \"蔵\", \"+\", \"ヨ\", \"頒\", \"緊\", \"殲\", \"憑\", \"痩\", \"摂\", \"Y\", \"8\", \"幹\", \"仮\", \"ぱ\", \"頬\", \"。\", \"亀\", \"」\", \"帯\", \"尋\", \"賞\", \"悪\", \"譲\", \"A\", \"❤\", \"揺\", \"臓\", \"掻\", \"2\", \"凱\", \"‥\", \" \", \"覧\", \"挙\", \"徹\", \"疇\", \"貞\", \"斬\", \"厭\", \"厳\", \"揶\", \"購\", \"鍵\", \"B\", \"囁\", \"栄\", \"籠\", \"練\", \"魚\", \"$\", \"枠\", \"壇\", \"樺\", \"喫\", \"傑\", \"霧\", \"閑\", \"継\", \"ヾ\", \"効\", \"諏\", \"亜\", \"詩\", \"輔\", \"証\", \"訣\", \"煩\", \"メ\", \"傷\", \"⑧\", \"滲\", \"賑\", \"園\", \"遙\", \"護\", \"偵\", \"釈\", \"凍\", \"棲\", \"興\", \"総\", \"牽\", \"鯖\", \"復\", \"説\", \"レ\", \"i\", \"曽\", \"寧\", \"筆\", \")\", \"執\", \"姉\", \"6\", \"薩\", \"価\", \"楓\", \"販\", \"訃\", \"テ\", \"維\", \"1\", \"ヨ\", \"隣\", \"陰\", \"遼\", \"羅\", \"減\", \"糧\", \"謄\", \"◡\", \"k\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/ko": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1524839,
"_n_tokens": 344411,
"_n_chars": 655190,
"_n_oov_chars": 430264,
"oov_ratio": 0.656701109601795,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"빈\", \"갈\", \"싱\", \"체\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"😂\", \"별\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"⑵\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"퍙\", \"루\", \"붐\", \"女\", \"*\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"£\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"툼\", \"컸\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"낮\", \"왓\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"피\", \"읊\", \"명\", \"뿜\", \"흑\", \"딘\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"♤\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"맬\", \"🦅\", \"쪄\", \"聖\", \"션\", \"히\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"준\", \"얏\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"©\", \"맷\", \"💥\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"문\", \"✔\", \"군\", \"픔\", \"킵\", \"뮤\", \"슬\", \"§\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"韓\", \"s\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"@\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"駐\", \"볍\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"훨\", \"걸\", \"돠\", \"🌵\", \"서\", \"숭\", \"換\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"樺\", \"흄\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"敎\", \"냉\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"임\", \"ㅔ\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"몸\", \"쥬\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"톨\", \"냈\", \"푸\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"峴\", \"챗\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"㉰\", \"본\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"課\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"🙌\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"뜩\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"⑴\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"납\", \" \", \"므\", \"릉\", \"텅\", \"우\", \"켐\", \"펠\", \"랐\", \"습\", \"강\", \"뛸\", \"색\", \"쌈\", \"€\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"韜\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"驚\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"燦\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"짊\", \"㏊\", \"젊\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"큰\", \"폿\", \"옐\", \"징\", \"蟄\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"觸\", \"얹\", \"ㅜ\", \"녜\", \"쯤\", \"잡\", \"류\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"용\", \"Ⅰ\", \"남\", \"귤\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"삼\", \"착\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"」\", \"Ⅸ\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"龍\", \"품\", \"얼\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"飮\", \"마\", \"탁\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"ClueAI/ChatYuan-large-v2 @ cc100/zh-Hans": {
"tokenizer": "ChatYuan-large-v2",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2633047,
"_n_tokens": 554154,
"_n_chars": 927311,
"_n_oov_chars": 68599,
"oov_ratio": 0.0739762603916054,
"_oov_charset": "[\"a\", \"©\", \"擤\", \"镏\", \"ς\", \" \", \"]\", \"③\", \"猡\", \"\", \"ㄓ\", \"5\", \"霊\", \"n\", \" \", \"9\", \"艋\", \"⒀\", \"C\", \"?\", \"鼯\", \"屣\", \"Ø\", \".\", \"嘣\", \"戢\", \"④\", \"浞\", \"倨\", \"慮\", \"噴\", \"損\", \"⑩\", \"\", \"p\", \"t\", \"疴\", \"锒\", \"⑶\", \"卍\", \"-\", \"旆\", \"ὐ\", \"V\", \"4\", \"…\", \"壓\", \"彙\", \"韪\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"î\", \"⑷\", \"D\", \"忪\", \"„\", \"\", \"7\", \"\", \",\", \"屄\", \"龇\", \"円\", \"瑑\", \"�\", \"h\", \"・\", \"②\", \"⑸\", \"狳\", \"\", \"劑\", \"r\", \"3\", \"\\u0000\", \"託\", \"犰\", \"+\", \"耩\", \"⒂\", \"毎\", \"阽\", \"亂\", \"鲎\", \"e\", \"8\", \"⑨\", \"啐\", \"歩\", \"\\u0005\", \"溘\", \"&\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"漲\", \"ό\", \"\\u0006\", \"_\", \"2\", \" \", \"\", \"⑤\", \"ê\", \"逑\", \"\", \"▪\", \"T\", \":\", \"铩\", \"0\", \"黢\", \"%\", \"旳\", \"〝\", \"⑥\", \"挲\", \"/\", \"採\", \"⒌\", \"⑴\", \"唷\", \"⑧\", \"瑒\", \"撐\", \"娛\", \"⒃\", \"⑦\", \"[\", \"瑢\", \"黧\", \"併\", \"i\", \"瑧\", \"⒋\", \"黩\", \"!\", \"賣\", \")\", \"岣\", \"6\", \""\", \"薩\", \";\", \"篢\", \"欸\", \"〃\", \"矍\", \"1\", \"ヨ\", \"\\u0007\", \"(\", \"s\", \"灑\", \"瑨\", \"舎\", \"N\", \"讦\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/ar": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2813283,
"_n_tokens": 996313,
"_n_chars": 1560987,
"_n_oov_chars": 928499,
"oov_ratio": 0.5948153315818774,
"_oov_charset": "[\"م\", \"©\", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"ذ\", \"😀\", \"خ\", \"ۤ\", \"د\", \"۰\", \"٨\", \"▫\", \"\", \"٦\", \"
\", \"ْ\", \"ٌ\", \"😊\", \"ج\", \"█\", \"¡\", \"‹\", \"\", \"…\", \"ن\", \"♥\", \"χ\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"ۖ\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"١\", \"و\", \"\", \"Х\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"٥\", \"ﻹ\", \"ـ\", \"«\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"٤\", \"ء\", \"ή\", \"″\", \"ص\", \"ّ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/de": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1814876,
"_n_tokens": 960463,
"_n_chars": 1784021,
"_n_oov_chars": 5170,
"oov_ratio": 0.002897947950164264,
"_oov_charset": "[\"©\", \"€\", \"u\", \"¶\", \"ớ\", \"↩\", \"İ\", \"ς\", \"§\", \"😂\", \"\", \"‹\", \"č\", \"\", \"Á\", \"➔\", \"£\", \" \", \"¿\", \"ι\", \"ô\", \"ć\", \"☺\", \"…\", \"¼\", \"²\", \"♥\", \"\", \"😃\", \"\", \"¬\", \"¤\", \"â\", \"😈\", \"œ\", \"Ø\", \"š\", \"❤\", \"‚\", \"😀\", \"Ã\", \"ė\", \"›\", \"😦\", \"🙄\", \"Ö\", \"Ü\", \"‽\", \"😉\", \"„\", \"ï\", \"ư\", \"🙁\", \"‐\", \"û\", \"😆\", \"\", \"Ÿ\", \"Ä\", \"ø\", \"ß\", \"¹\", \"™\", \"\", \"å\", \"ń\", \"½\", \"�\", \"😢\", \"´\", \"ί\", \"«\", \"̈\", \"♦\", \"🙂\", \"♡\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/en": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1124813,
"_n_tokens": 526033,
"_n_chars": 1121360,
"_n_oov_chars": 141,
"oov_ratio": 0.00012574017264749946,
"_oov_charset": "[\"③\", \"¡\", \"£\", \"⑧\", \"¦\", \"\", \"…\", \"⑦\", \"‑\", \"😉\", \"ï\", \"😥\", \"\", \"⑤\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"´\", \"\", \"«\", \"🙂\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/es": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1664455,
"_n_tokens": 879530,
"_n_chars": 1630297,
"_n_oov_chars": 3885,
"oov_ratio": 0.002383001379503244,
"_oov_charset": "[\"✓\", \"©\", \"€\", \"¡\", \"ý\", \"Á\", \"\", \"¿\", \"️\", \"ô\", \"…\", \"²\", \"▷\", \"😀\", \"❤\", \"Í\", \"\", \"😦\", \"😉\", \"🙁\", \"👍\", \"º\", \"ª\", \"\", \"ø\", \"ñ\", \"Ñ\", \"✪\", \"″\", \"✔\", \"\", \"Ú\", \"👏\", \"´\", \"«\", \"Ó\", \"🙂\", \"✖\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/fa": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2054052,
"_n_tokens": 730377,
"_n_chars": 1145876,
"_n_oov_chars": 744234,
"oov_ratio": 0.6494891244776921,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"د\", \"۰\", \"٨\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"چ\", \"ة\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"�\", \"ظ\", \"ح\", \"ت\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"\", \"❤\", \"ڪ\", \"›\", \"؛\", \"ב\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"٥\", \"٫\", \"ـ\", \"«\", \"ٍ\", \"ش\", \"س\", \"۷\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"ء\", \"گ\", \"۴\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/fr": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1540504,
"_n_tokens": 812012,
"_n_chars": 1484970,
"_n_oov_chars": 5502,
"oov_ratio": 0.0037051253560677995,
"_oov_charset": "[\"€\", \"§\", \"♠\", \"Â\", \"Î\", \"…\", \"²\", \"À\", \"â\", \"̧\", \"℃\", \"ğ\", \"́\", \"µ\", \"œ\", \"❤\", \"😀\", \"ë\", \"î\", \"😉\", \"ã\", \"Ê\", \"ï\", \"‐\", \"û\", \"🤔\", \"♕\", \"\", \"«\", \"Ô\", \"ê\", \"″\", \"
\", \"™\", \"È\", \"�\", \"´\", \"ô\", \"̂\", \"Ç\", \"🙂\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/ja": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1774770,
"_n_tokens": 565505,
"_n_chars": 603065,
"_n_oov_chars": 26633,
"oov_ratio": 0.044162735360201634,
"_oov_charset": "[\"a\", \"増\", \"ー\", \"濫\", \"③\", \"蛍\", \"嶽\", \"綜\", \"監\", \"9\", \"瀬\", \"慄\", \"f\", \"C\", \"釘\", \"針\", \"∀\", \"紐\", \"✨\", \"ぃ\", \"諸\", \"腫\", \"嘗\", \"載\", \"須\", \"ハ\", \"塗\", \"飽\", \"膚\", \"庁\", \".\", \"綾\", \"彿\", \"絡\", \"ヲ\", \"僕\", \"妬\", \"囲\", \"I\", \"穫\", \"鉢\", \"欝\", \"噴\", \"悩\", \"絞\", \"損\", \"騰\", \"聖\", \"⑩\", \"K\", \"貿\", \"貰\", \"両\", \"蓮\", \"競\", \"誠\", \"ぅ\", \"t\", \"嘆\", \"R\", \"喩\", \"腎\", \"嗚\", \"筈\", \"壊\", \"勝\", \"乗\", \"撫\", \"罰\", \"讃\", \"稲\", \"糞\", \"凪\", \"傾\", \"…\", \"徴\", \"¥\", \"澪\", \"夢\", \"🌙\", \"衝\", \"誘\", \"d\", \"縮\", \"遺\", \"協\", \"婦\", \"暦\", \"鑑\", \"G\", \"F\", \"駆\", \"緩\", \">\", \"箋\", \"謳\", \"暁\", \"ロ\", \"円\", \"靄\", \"債\", \"帰\", \"検\", \"・\", \"②\", \"犠\", \"ぉ\", \"糾\", \"獲\", \"雲\", \"呂\", \"財\", \"゚\", \"燭\", \"鎮\", \"項\", \"銃\", \"閣\", \"暢\", \"轢\", \"穢\", \"穏\", \"紙\", \"抜\", \"晩\", \"\\", \"揚\", \"毎\", \"薦\", \"و\", \"涙\", \"擁\", \"鍋\", \"桟\", \"働\", \"暫\", \"揮\", \"鳴\", \"ヵ\", \"梶\", \"&\", \"偉\", \"輩\", \"駄\", \"韮\", \"陳\", \"詠\", \"圏\", \"淵\", \"「\", \"ヘ\", \"ゝ\", \"丿\", \"館\", \"コ\", \"謗\", \"渓\", \"誌\", \"鉄\", \"診\", \"猟\", \"帳\", \"臨\", \"粧\", \"瘍\", \"岡\", \"´\", \"ぽ\", \"緑\", \"«\", \"鋲\", \"労\", \"礎\", \"測\", \"瘻\", \"槍\", \"頻\", \"違\", \"0\", \"嵐\", \"儀\", \"%\", \"貨\", \"縄\", \"|\", \"揃\", \"/\", \"躊\", \"慣\", \"審\", \"氷\", \"訳\", \"侶\", \"S\", \"゚\", \"[\", \"礫\", \"勲\", \"寛\", \"億\", \"ぬ\", \"b\", \"獣\", \"臥\", \"訝\", \"闘\", \"恵\", \"広\", \"X\", \"綴\", \"喪\", \"陣\", \"紹\", \"週\", \"佇\", \"轄\", \"敗\", \"輪\", \"躾\", \"騒\", \"賃\", \"棟\", \"貪\", \"丼\", \"痺\", \"豊\", \"♪\", \"✧\", \"賛\", \"舎\", \"預\", \"歓\", \"顔\", \"④\", \"鶴\", \"]\", \"賭\", \"霊\", \"袴\", \"郷\", \"鮮\", \"兎\", \"蠍\", \"彡\", \"鴻\", \"閉\", \"爾\", \"ㅂ\", \"鳥\", \"涼\", \"蒔\", \"ぞ\", \"酔\", \"姦\", \"軒\", \"M\", \"転\", \"織\", \"訊\", \"倫\", \"陽\", \"貫\", \"貧\", \"養\", \"談\", \"険\", \"辿\", \"錠\", \"桜\", \"錬\", \"捩\", \"彫\", \"篠\", \"貼\", \"孫\", \"扱\", \"粋\", \"鬱\", \"緻\", \"悶\", \"課\", \"懇\", \"餌\", \"-\", \"児\", \"戯\", \"墜\", \"4\", \"Z\", \"衆\", \"窓\", \"諺\", \"仏\", \"纒\", \"ゾ\", \"誹\", \"冊\", \"艸\", \"℃\", \"呟\", \"絆\", \"①\", \"ぼ\", \"▷\", \"殻\", \"罠\", \"緒\", \"庫\", \"D\", \"\", \"漬\", \"ゥ\", \"択\", \"7\", \"劉\", \"逡\", \"謡\", \"娯\", \"h\", \"�\", \"呑\", \"払\", \"剣\", \"∇\", \"P\", \"=\", \"篤\", \"聾\", \"♡\", \"撲\", \"訓\", \"賊\", \"銘\", \"誤\", \"遡\", \"挿\", \"訟\", \"飼\", \"閃\", \"諾\", \"図\", \"済\", \"⇔\", \"唸\", \"隕\", \"剤\", \"嘩\", \"圧\", \"捲\", \"詰\", \"鏡\", \"奪\", \"聴\", \"編\", \"羨\", \"馳\", \"鉛\", \"顎\", \"⻑\", \"\\b\", \"砕\", \"畳\", \"💦\", \"闊\", \"潰\", \"馴\", \"_\", \"訂\", \"麗\", \"掴\", \"濃\", \"樹\", \"詫\", \"誕\", \"ゥ\", \"😢\", \"゙\", \"⌒\", \"鋭\", \"賢\", \"T\", \"隠\", \"績\", \"綺\", \"艶\", \"梱\", \"w\", \"慶\", \"飲\", \"採\", \"趨\", \"俵\", \"訪\", \"惣\", \"衛\", \"詈\", \"雰\", \"駒\", \"併\", \"滅\", \"棄\", \"斂\", \"`\", \"捜\", \"順\", \"灘\", \"虜\", \"従\", \"ぇ\", \"♫\", \"^\", \"恥\", \"闖\", \"謀\", \"巣\", \";\", \"Д\", \"憂\", \"橋\", \"懸\", \"僅\", \"ぁ\", \"鎌\", \"贅\", \"戻\", \"雑\", \"ノ\", \"薬\", \"ウ\", \"艦\", \"N\", \"歴\", \"y\", \"纏\", \"©\", \"療\", \"紋\", \"醤\", \"5\", \"譜\", \"n\", \"脳\", \"憲\", \"懐\", \"*\", \"農\", \"軽\", \"貴\", \"饉\", \"L\", \"絶\", \"積\", \"湧\", \"鵜\", \"貸\", \"産\", \"譚\", \"脇\", \"軸\", \"陥\", \"Q\", \"緯\", \"๑\", \"ぴ\", \"渦\", \"備\", \"弾\", \"奨\", \"\", \"縦\", \"腸\", \"嚥\", \"紗\", \"謂\", \"側\", \"ゞ\", \"繊\", \"飾\", \"頂\", \"慮\", \"駕\", \"宮\", \"髭\", \"郵\", \"災\", \"鎖\", \"カ\", \"欄\", \"顕\", \"g\", \"<\", \"誇\", \"匂\", \"😊\", \"醸\", \"⇒\", \"曇\", \"鐘\", \"V\", \"ヌ\", \"麺\", \"冨\", \"龍\", \"蝋\", \"塚\", \"駅\", \"彙\", \"⑪\", \"職\", \"墾\", \"輸\", \"o\", \"欽\", \"喰\", \"醜\", \"絵\", \"憶\", \"団\", \"売\", \"曖\", \"◯\", \"鈴\", \"贈\", \"憤\", \"讐\", \",\", \"鱈\", \"渋\", \"潔\", \"頷\", \"壌\", \"O\", \"拡\", \"E\", \"純\", \"墳\", \"謙\", \"Ⅹ\", \"島\", \"贔\", \"鶏\", \"斎\", \"ぷ\", \"̈\", \"終\", \"営\", \"躍\", \"舗\", \"3\", \"償\", \"勧\", \"倉\", \"H\", \"噛\", \"綱\", \"塊\", \"峠\", \"縫\", \"渉\", \"喚\", \"異\", \"ぜ\", \"鞄\", \"締\", \"e\", \"捗\", \"領\", \"幣\", \"負\", \"歩\", \"銀\", \"焼\", \"‼\", \"㎞\", \"頑\", \"構\", \"舘\", \"膿\", \"複\", \"J\", \"潤\", \"縁\", \"縞\", \"\", \"擬\", \"堅\", \"拠\", \"̀\", \"栃\", \"辺\", \"傘\", \"麹\", \"詮\", \"餃\", \"飴\", \"脈\", \"l\", \":\", \"汎\", \"諦\", \"ィ\", \"拝\", \"〝\", \"贋\", \"氾\", \"猶\", \"額\", \"噂\", \"屓\", \"リ\", \"掲\", \"齢\", \"〟\", \"歯\", \"覇\", \" ̄\", \"貢\", \"熱\", \"貶\", \"鍛\", \"!\", \"唄\", \"責\", \"覗\", \"剰\", \"渕\", \"遅\", \"飛\", \"費\", \"″\", \"(\", \"韓\", \"s\", \"荘\", \"ヘ\", \"、\", \"蓋\", \"?\", \"繰\", \"塩\", \"詐\", \"罵\", \"餓\", \"敵\", \" \", \"頃\", \"遜\", \"飢\", \"ア\", \"髪\", \"W\", \"@\", \"漁\", \"啓\", \"範\", \"繍\", \"〆\", \"窪\", \"層\", \"貯\", \"脅\", \"処\", \"懲\", \"フ\", \"捨\", \"釣\", \"験\", \"値\", \"満\", \"覚\", \"゙\", \"権\", \"込\", \"紀\", \"摯\", \"勢\", \"賠\", \"軋\", \"掛\", \"癒\", \"儲\", \"湯\", \"飯\", \"駿\", \"訴\", \"謎\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"餅\", \"納\", \"滝\", \"輿\", \"駐\", \"築\", \"楊\", \"浄\", \"繋\", \"漑\", \"貝\", \"磯\", \"詳\", \"観\", \"輝\", \"彌\", \"汚\", \"環\", \"賀\", \"渇\", \"嬢\", \"頓\", \"ゎ\", \"適\", \"掃\", \"ヶ\", \"跡\", \"騙\", \"穂\", \"︎\", \"綻\", \"閲\", \"斉\", \"煙\", \"廃\", \"澤\", \"紡\", \"絨\", \"銭\", \"‐\", \"聞\", \"﨑\", \"m\", \"\\u001b\", \"沖\", \"換\", \"襲\", \"階\", \"専\", \"奮\", \"謬\", \"廻\", \"鉱\", \"洩\", \"😌\", \"獄\", \"窮\", \"偽\", \"黙\", \"紛\", \"綬\", \"穀\", \"縛\", \"軟\", \"簗\", \"r\", \"拶\", \"ゼ\", \"頼\", \"託\", \"顧\", \"塵\", \"殺\", \"U\", \"鈍\", \"驚\", \"軌\", \"蔵\", \"+\", \"ヨ\", \"頒\", \"緊\", \"殲\", \"憑\", \"痩\", \"摂\", \"Y\", \"8\", \"幹\", \"仮\", \"ぱ\", \"頬\", \"。\", \"亀\", \"」\", \"帯\", \"尋\", \"賞\", \"悪\", \"譲\", \"A\", \"❤\", \"揺\", \"臓\", \"掻\", \"2\", \"凱\", \"‥\", \" \", \"覧\", \"挙\", \"徹\", \"疇\", \"貞\", \"斬\", \"厭\", \"厳\", \"揶\", \"購\", \"鍵\", \"B\", \"囁\", \"栄\", \"籠\", \"練\", \"魚\", \"$\", \"枠\", \"壇\", \"樺\", \"喫\", \"傑\", \"霧\", \"閑\", \"継\", \"ヾ\", \"効\", \"諏\", \"亜\", \"詩\", \"輔\", \"証\", \"訣\", \"煩\", \"メ\", \"傷\", \"⑧\", \"滲\", \"賑\", \"園\", \"遙\", \"護\", \"偵\", \"釈\", \"凍\", \"棲\", \"興\", \"総\", \"牽\", \"鯖\", \"復\", \"説\", \"レ\", \"i\", \"曽\", \"寧\", \"筆\", \")\", \"執\", \"姉\", \"6\", \"薩\", \"価\", \"楓\", \"販\", \"訃\", \"テ\", \"維\", \"1\", \"ヨ\", \"隣\", \"陰\", \"遼\", \"羅\", \"減\", \"糧\", \"謄\", \"◡\", \"k\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/ko": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 1524839,
"_n_tokens": 344411,
"_n_chars": 655190,
"_n_oov_chars": 430264,
"oov_ratio": 0.656701109601795,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"빈\", \"갈\", \"싱\", \"체\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"😂\", \"별\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"⑵\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"퍙\", \"루\", \"붐\", \"女\", \"*\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"£\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"툼\", \"컸\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"낮\", \"왓\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"피\", \"읊\", \"명\", \"뿜\", \"흑\", \"딘\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"♤\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"맬\", \"🦅\", \"쪄\", \"聖\", \"션\", \"히\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"준\", \"얏\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"©\", \"맷\", \"💥\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"문\", \"✔\", \"군\", \"픔\", \"킵\", \"뮤\", \"슬\", \"§\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"韓\", \"s\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"@\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"駐\", \"볍\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"훨\", \"걸\", \"돠\", \"🌵\", \"서\", \"숭\", \"換\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"樺\", \"흄\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"敎\", \"냉\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"임\", \"ㅔ\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"몸\", \"쥬\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"톨\", \"냈\", \"푸\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"峴\", \"챗\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"㉰\", \"본\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"課\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"🙌\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"뜩\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"⑴\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"납\", \" \", \"므\", \"릉\", \"텅\", \"우\", \"켐\", \"펠\", \"랐\", \"습\", \"강\", \"뛸\", \"색\", \"쌈\", \"€\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"韜\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"驚\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"燦\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"짊\", \"㏊\", \"젊\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"큰\", \"폿\", \"옐\", \"징\", \"蟄\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"觸\", \"얹\", \"ㅜ\", \"녜\", \"쯤\", \"잡\", \"류\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"용\", \"Ⅰ\", \"남\", \"귤\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"삼\", \"착\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"」\", \"Ⅸ\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"龍\", \"품\", \"얼\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"飮\", \"마\", \"탁\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"ClueAI/PromptCLUE-base @ cc100/zh-Hans": {
"tokenizer": "PromptCLUE-base",
"organization": "CLUE",
"vocab_size": 32128,
"_n_bytes": 2633047,
"_n_tokens": 554154,
"_n_chars": 927311,
"_n_oov_chars": 68599,
"oov_ratio": 0.0739762603916054,
"_oov_charset": "[\"a\", \"©\", \"擤\", \"镏\", \"ς\", \" \", \"]\", \"③\", \"猡\", \"\", \"ㄓ\", \"5\", \"霊\", \"n\", \" \", \"9\", \"艋\", \"⒀\", \"C\", \"?\", \"鼯\", \"屣\", \"Ø\", \".\", \"嘣\", \"戢\", \"④\", \"浞\", \"倨\", \"慮\", \"噴\", \"損\", \"⑩\", \"\", \"p\", \"t\", \"疴\", \"锒\", \"⑶\", \"卍\", \"-\", \"旆\", \"ὐ\", \"V\", \"4\", \"…\", \"壓\", \"彙\", \"韪\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"î\", \"⑷\", \"D\", \"忪\", \"„\", \"\", \"7\", \"\", \",\", \"屄\", \"龇\", \"円\", \"瑑\", \"�\", \"h\", \"・\", \"②\", \"⑸\", \"狳\", \"\", \"劑\", \"r\", \"3\", \"\\u0000\", \"託\", \"犰\", \"+\", \"耩\", \"⒂\", \"毎\", \"阽\", \"亂\", \"鲎\", \"e\", \"8\", \"⑨\", \"啐\", \"歩\", \"\\u0005\", \"溘\", \"&\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"漲\", \"ό\", \"\\u0006\", \"_\", \"2\", \" \", \"\", \"⑤\", \"ê\", \"逑\", \"\", \"▪\", \"T\", \":\", \"铩\", \"0\", \"黢\", \"%\", \"旳\", \"〝\", \"⑥\", \"挲\", \"/\", \"採\", \"⒌\", \"⑴\", \"唷\", \"⑧\", \"瑒\", \"撐\", \"娛\", \"⒃\", \"⑦\", \"[\", \"瑢\", \"黧\", \"併\", \"i\", \"瑧\", \"⒋\", \"黩\", \"!\", \"賣\", \")\", \"岣\", \"6\", \""\", \"薩\", \";\", \"篢\", \"欸\", \"〃\", \"矍\", \"1\", \"ヨ\", \"\\u0007\", \"(\", \"s\", \"灑\", \"瑨\", \"舎\", \"N\", \"讦\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/ar": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2813283,
"_n_tokens": 621736,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"\", \"…\", \"″\", \"\", \"\", \"�\", \"
\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"\", \"\", \"ﻷ\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/de": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1814876,
"_n_tokens": 470418,
"_n_chars": 1784021,
"_n_oov_chars": 524,
"oov_ratio": 0.0002937185156452755,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/en": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1124813,
"_n_tokens": 307881,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"�\", \"´\", \"‑\", \"⑧\", \"\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/es": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1664455,
"_n_tokens": 462231,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/fa": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2054052,
"_n_tokens": 419922,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"\", \"…\", \"\", \"\", \" \", \"�\", \"ﮧ\", \"\", \"\", \"\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/fr": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1540504,
"_n_tokens": 460944,
"_n_chars": 1484970,
"_n_oov_chars": 870,
"oov_ratio": 0.0005858704216246792,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/ja": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1774770,
"_n_tokens": 290542,
"_n_chars": 603065,
"_n_oov_chars": 6762,
"oov_ratio": 0.011212721680084236,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"④\", \"I\", \"Ⅱ\", \"⑩\", \"K\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"g\", \"<\", \"-\", \"V\", \"4\", \"Z\", \"…\", \"¥\", \"纒\", \"⑪\", \"℃\", \"①\", \"o\", \"d\", \"G\", \"D\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ウ\", \"r\", \"3\", \"゚\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"A\", \"⻑\", \"\\b\", \"‼\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"\", \"B\", \"$\", \"´\", \"T\", \"l\", \":\", \"0\", \"ィ\", \"%\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/ko": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 1524839,
"_n_tokens": 424586,
"_n_chars": 655190,
"_n_oov_chars": 1365,
"oov_ratio": 0.0020833651307254385,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"*\", \"ㄷ\", \"@\", \"\", \"ㅜ\", \"ㅐ\", \"〮\", \"Ⅷ\", \"ㅛ\", \"④\", \"킌\", \"․\", \"ㅝ\", \"삣\", \"Ⅱ\", \"ㄹ\", \"\", \"➏\", \"Ⅶ\", \"㏊\", \"힉\", \"Ⅵ\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"챨\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"힜\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"�\", \"②\", \"⑸\", \"璣\", \"츈\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"\", \"ㅢ\", \"퍙\", \"ㅈ\", \"ㅋ\", \"㎡\", \"ㅑ\", \"梁\", \"쒀\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"렜\", \"쓕\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"웖\", \"뾱\", \"㉿\", \"‥\", \" \", \"樂\", \"流\", \"\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"왘\", \"ㅆ\", \"쫗\", \"ㅘ\", \":\", \"⑹\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"폍\", \"뭥\", \"⑦\", \"ⅱ\", \"ⅰ\", \"綃\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"흗\", \"ㅎ\", \"\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"꿕\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"?\"]",
"reversible": false
},
"CohereForAI/aya-101 @ cc100/zh-Hans": {
"tokenizer": "aya-101",
"organization": "Cohere For AI",
"vocab_size": 250100,
"_n_bytes": 2633047,
"_n_tokens": 621182,
"_n_chars": 927311,
"_n_oov_chars": 68514,
"oov_ratio": 0.07388459750827932,
"_oov_charset": "[\"a\", \"擤\", \"猡\", \" \", \"]\", \"③\", \"\", \"5\", \"n\", \" \", \"9\", \"⒀\", \"C\", \"?\", \"鼯\", \".\", \"犄\", \"⑩\", \"\", \"p\", \"t\", \"腭\", \"锒\", \"⑶\", \"-\", \"V\", \"4\", \"…\", \"佝\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"\", \"7\", \"\", \",\", \"瑑\", \"�\", \"h\", \"・\", \"②\", \"⑸\", \"鲱\", \"r\", \"3\", \"\\u0000\", \"犰\", \"+\", \"耩\", \"⒂\", \"阽\", \"e\", \"8\", \"⑨\", \"\\u0005\", \"&\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"\\u0006\", \"_\", \"2\", \" \", \"\", \"⑤\", \"棂\", \"T\", \":\", \"0\", \"黢\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \"瑒\", \"⒃\", \"⑦\", \"[\", \"瑢\", \"i\", \"⒋\", \"黩\", \"!\", \")\", \"6\", \""\", \";\", \"篢\", \"1\", \"\\u0007\", \"(\", \"s\", \"瑨\", \"N\", \"④\"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/ar": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2813283,
"_n_tokens": 1106277,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/de": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1814876,
"_n_tokens": 583628,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"̈\", \"u\"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/en": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/es": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/fa": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2054052,
"_n_tokens": 866434,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/fr": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/ja": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1774770,
"_n_tokens": 605168,
"_n_chars": 603065,
"_n_oov_chars": 465,
"oov_ratio": 0.0007710611625612496,
"_oov_charset": "[\"と\", \"シ\", \"せ\", \"ハ\", \" \", \"す\", \"つ\", \"て\", \"゚\", \"ひ\", \"は\", \"フ\", \"へ\", \"か\", \"た\", \"し\", \"コ\", \"ス\", \"く\", \"ヒ\", \"ト\", \"゙\", \"ふ\", \"ホ\"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/ko": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 1524839,
"_n_tokens": 973288,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"累\", \"龍\", \"識\", \"理\", \"梁\", \"金\", \"女\", \"樂\", \"靈\", \"樂\", \"不\", \"流\", \"陸\", \"良\"]",
"reversible": false
},
"EleutherAI/gpt-neox-20b @ cc100/zh-Hans": {
"tokenizer": "gpt-neox-20b",
"organization": "EleutherAI",
"vocab_size": 50277,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/ar": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2813283,
"_n_tokens": 498287,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"\", \"…\", \"″\", \"\", \"\", \"�\", \"
\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"\", \"\", \"ﻷ\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/de": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1814876,
"_n_tokens": 412571,
"_n_chars": 1784021,
"_n_oov_chars": 525,
"oov_ratio": 0.0002942790471636825,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"‽\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/en": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1124813,
"_n_tokens": 280026,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"�\", \"´\", \"‑\", \"⑧\", \"\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/es": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1664455,
"_n_tokens": 379850,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/fa": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2054052,
"_n_tokens": 310926,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"\", \"…\", \"\", \"\", \" \", \"�\", \"ﮧ\", \"\", \"\", \"\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/fr": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1540504,
"_n_tokens": 385041,
"_n_chars": 1484970,
"_n_oov_chars": 872,
"oov_ratio": 0.0005872172501801383,
"_oov_charset": "[\"…\", \"
\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/ja": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1774770,
"_n_tokens": 324820,
"_n_chars": 603065,
"_n_oov_chars": 6779,
"oov_ratio": 0.011240911012909057,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"饉\", \"L\", \"ハ\", \"杼\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"④\", \"I\", \"欝\", \"Ⅱ\", \"⑩\", \"K\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"g\", \"<\", \"漑\", \"-\", \"V\", \"4\", \"Z\", \"…\", \"¥\", \"纒\", \"⑪\", \"℃\", \"ゎ\", \"①\", \"o\", \"d\", \"G\", \"D\", \"\", \"F\", \"ゥ\", \">\", \"7\", \"﨑\", \"m\", \"\\u001b\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \"碓\", \"ウ\", \"簗\", \"r\", \"3\", \"゚\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"韮\", \"A\", \"‼\", \"\\b\", \"⻑\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"\", \"B\", \"$\", \"´\", \"鋲\", \"瘻\", \"T\", \"l\", \":\", \"0\", \"ィ\", \"%\", \"|\", \"贋\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"詈\", \"S\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/ko": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 1524839,
"_n_tokens": 354571,
"_n_chars": 655190,
"_n_oov_chars": 1403,
"oov_ratio": 0.002141363573925121,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"趺\", \"*\", \"ㄷ\", \"@\", \"悧\", \"\", \"ㅜ\", \"➎\", \"ㅐ\", \"〮\", \"Ⅷ\", \"ㅛ\", \"④\", \"🏷\", \"킌\", \"․\", \"킁\", \"⚀\", \"ㅝ\", \"跏\", \"삣\", \"Ⅱ\", \"ㄹ\", \"\", \"➏\", \"🚿\", \"Ⅶ\", \"띕\", \"㏊\", \"썅\", \"Ⅵ\", \"⑶\", \"섦\", \"㎍\", \"ㅡ\", \"쟤\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"챨\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"🌵\", \"🗺\", \"힜\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"�\", \"②\", \"⑸\", \"츈\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"\", \"ㅢ\", \"퍙\", \"ㅈ\", \"蚩\", \"㎡\", \"ㅋ\", \"ㅑ\", \"🍞\", \"梁\", \"쒀\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"렜\", \"쓕\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"웖\", \"뾱\", \"㉿\", \"‥\", \" \", \"樂\", \"流\", \"➍\", \"🍭\", \"\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"卽\", \"왘\", \"ㅆ\", \"쫗\", \"ㅘ\", \"➌\", \":\", \"⑹\", \"%\", \"🤕\", \"|\", \"⑥\", \"짢\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"폍\", \"뭥\", \"⑦\", \"ⅱ\", \"🍟\", \"ⅰ\", \"綃\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"\", \"㉣\", \"Ⅴ\", \"흗\", \"ㅎ\", \"\", \"🥁\", \"㎥\", \"識\", \"믐\", \"Ⅳ\", \"s\", \"槪\", \"꿕\", \"樂\", \"삘\", \"㉰\", \"ㅟ\", \"良\", \"?\"]",
"reversible": false
},
"FacebookAI/xlm-roberta-base @ cc100/zh-Hans": {
"tokenizer": "xlm-roberta-base",
"organization": "Facebook",
"vocab_size": 250002,
"_n_bytes": 2633047,
"_n_tokens": 599844,
"_n_chars": 927311,
"_n_oov_chars": 68556,
"oov_ratio": 0.07392988975651103,
"_oov_charset": "[\"a\", \"翕\", \"擤\", \"镏\", \"猡\", \" \", \"]\", \"③\", \"\", \"5\", \"n\", \" \", \"9\", \"⒀\", \"C\", \"?\", \"鼯\", \"浠\", \"屣\", \"牖\", \".\", \"戢\", \"④\", \"浞\", \"犄\", \"倨\", \"樯\", \"⑩\", \"\", \"p\", \"韫\", \"t\", \"疴\", \"⑶\", \"鄯\", \"-\", \"旆\", \"V\", \"4\", \"…\", \"茏\", \"穰\", \"韪\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"\", \"7\", \"\", \",\", \"逶\", \"瑑\", \"�\", \"h\", \"・\", \"②\", \"⑸\", \"聒\", \"鲱\", \"狳\", \"\", \"r\", \"3\", \"\\u0000\", \"偻\", \"诨\", \"犰\", \"+\", \"耩\", \"⒂\", \"纰\", \"阽\", \"鲎\", \"e\", \"8\", \"⑨\", \"撷\", \"\\u0005\", \"&\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"\\u0006\", \"_\", \"2\", \"傥\", \" \", \"\", \"⑤\", \"勖\", \"棂\", \"\", \"T\", \":\", \"0\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \"瑒\", \"飕\", \"⒃\", \"⑦\", \"[\", \"瑢\", \"黧\", \"i\", \"嘭\", \"瑧\", \"⒋\", \"黩\", \"!\", \")\", \"岣\", \"6\", \""\", \"绉\", \";\", \"篢\", \"矍\", \"1\", \"\\u0007\", \"(\", \"s\", \"鳃\", \"瑨\", \"N\", \"讦\"]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ar": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2813283,
"_n_tokens": 1195640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/de": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1814876,
"_n_tokens": 620541,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/en": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1124813,
"_n_tokens": 288965,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/es": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1664455,
"_n_tokens": 530592,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/fa": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2054052,
"_n_tokens": 851630,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/fr": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1540504,
"_n_tokens": 509958,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ja": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1774770,
"_n_tokens": 546876,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/ko": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 1524839,
"_n_tokens": 580873,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"HuggingFaceH4/starchat-alpha @ cc100/zh-Hans": {
"tokenizer": "starchat-alpha",
"organization": "-",
"vocab_size": 49156,
"_n_bytes": 2633047,
"_n_tokens": 882018,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ar": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/de": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/en": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/es": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/fa": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/fr": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ja": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/ko": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"HuggingFaceH4/zephyr-7b-beta @ cc100/zh-Hans": {
"tokenizer": "zephyr-7b-beta",
"organization": "HuggingFace",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/ar": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/de": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/en": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/es": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/fa": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/fr": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/ja": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/ko": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"LLM360/CrystalCoder @ cc100/zh-Hans": {
"tokenizer": "CrystalCoder",
"organization": "MBZUAI",
"vocab_size": 32022,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ar": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/de": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/en": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/es": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/fa": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/fr": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ja": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/ko": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"NousResearch/Llama-2-7b-chat-hf @ cc100/zh-Hans": {
"tokenizer": "llama2",
"organization": "Meta",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"OrionStarAI/Orion-14B-Chat @ cc100/ar": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2813283,
"_n_tokens": 1531053,
"_n_chars": 1560987,
"_n_oov_chars": 1513,
"oov_ratio": 0.0009692585524415002,
"_oov_charset": "[\"ٌ\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"ﻷ\", \"\", \"…\", \"\", \"⤴\", \"ۚ\", \"٪\", \"ۗ\", \"ۖ\", \"\", \"﴿\", \"ۤ\", \"؛\", \"\", \"″\", \"\", \"ٰ\", \"�\", \"﴾\", \"½\", \"
\", \"ﻹ\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/de": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1814876,
"_n_tokens": 744404,
"_n_chars": 1784021,
"_n_oov_chars": 524,
"oov_ratio": 0.0002937185156452755,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/en": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1124813,
"_n_tokens": 265948,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"�\", \"´\", \"‑\", \"⑧\", \"\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/es": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1664455,
"_n_tokens": 628571,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/fa": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2054052,
"_n_tokens": 1131108,
"_n_chars": 1145876,
"_n_oov_chars": 8144,
"oov_ratio": 0.007107226261829378,
"_oov_charset": "[\"ٌ\", \"ٔ\", \"\", \"…\", \"ۀ\", \"ۆ\", \"\", \"؛\", \"\", \"�\", \"۔\", \"ﮧ\", \"٪\", \"ٴ\", \"\", \"\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/fr": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1540504,
"_n_tokens": 564107,
"_n_chars": 1484970,
"_n_oov_chars": 870,
"oov_ratio": 0.0005858704216246792,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/ja": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1774770,
"_n_tokens": 324956,
"_n_chars": 603065,
"_n_oov_chars": 5188,
"oov_ratio": 0.00860272109971562,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \"③\", \"5\", \"n\", \"つ\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"④\", \"し\", \"I\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \")\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"-\", \"V\", \"4\", \"て\", \"Z\", \"…\", \"¥\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"\", \"コ\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \":\", \"ホ\", \"ウ\", \"簗\", \"r\", \"せ\", \"3\", \"゚\", \"す\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"\\b\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"\", \"ス\", \"B\", \"?\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \",\", \"T\", \"l\", \":\", \"0\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \";\", \"S\", \"゚\", \"ひ\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \"テ\", \"″\", \"1\", \"(\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"、\", \"!\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/ko": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 1524839,
"_n_tokens": 351149,
"_n_chars": 655190,
"_n_oov_chars": 1783,
"oov_ratio": 0.0027213480059219463,
"_oov_charset": "[\"뮈\", \"ⓒ\", \"③\", \"女\", \"쥰\", \"*\", \"ㄷ\", \"@\", \"\", \"ㅜ\", \"녜\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"④\", \"껀\", \"맬\", \"킌\", \"․\", \"킁\", \"⚀\", \"ㅝ\", \"삣\", \"Ⅱ\", \"ㄹ\", \"\", \")\", \"쫑\", \"Ⅶ\", \"쐬\", \"깽\", \"홑\", \"띕\", \"갛\", \"㏊\", \"썅\", \"힉\", \"Ⅵ\", \"⑶\", \"훠\", \"섦\", \"㎍\", \"ㅡ\", \"쟤\", \"ㅖ\", \"잴\", \"앎\", \"…\", \"ⅲ\", \"셌\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"챨\", \"①\", \"쳇\", \"ㄴ\", \"ㅣ\", \"갉\", \"Ⅰ\", \"쭙\", \"죤\", \"꺄\", \"롸\", \"봬\", \"돠\", \"틔\", \"힜\", \"넹\", \"¹\", \"ㅁ\", \"팹\", \"Ⅹ\", \"�\", \"ⅳ\", \"②\", \"⑸\", \":\", \"츈\", \"쌉\", \"ⓔ\", \"뗀\", \"㉠\", \"ㄱ\", \"ㆍ\", \"ㅢ\", \"퍙\", \"ㅈ\", \"㎡\", \"ㅋ\", \"ㅑ\", \"梁\", \"쒀\", \"⑨\", \"ㅓ\", \"뜹\", \"靈\", \"」\", \"빳\", \"Ⅸ\", \"ㅕ\", \"陸\", \"렜\", \"쓕\", \"궜\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"웖\", \"뾱\", \"㉿\", \"‥\", \" \", \"樂\", \"流\", \"\", \"쫒\", \"v\", \"⑤\", \"ㅍ\", \"?\", \"픕\", \"理\", \"왘\", \"ㅆ\", \"튿\", \"튄\", \",\", \"쫗\", \"ㅘ\", \":\", \"⑹\", \"흄\", \"%\", \"짢\", \"|\", \"⑥\", \"귈\", \"金\", \"뮐\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"폍\", \"뭥\", \"⑦\", \"ⅱ\", \"ⅰ\", \"탰\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"휙\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"뼘\", \"Ⅴ\", \"흗\", \"ㅎ\", \"\", \"㎥\", \"識\", \"믐\", \"Ⅳ\", \"(\", \"s\", \"솨\", \"꿕\", \"樂\", \"얍\", \"!\", \"삘\", \"㉰\", \"ㅟ\", \"쾨\", \"良\", \"?\"]",
"reversible": false
},
"OrionStarAI/Orion-14B-Chat @ cc100/zh-Hans": {
"tokenizer": "Orion-14B-Chat",
"organization": "OrionStar",
"vocab_size": 84608,
"_n_bytes": 2633047,
"_n_tokens": 529926,
"_n_chars": 927311,
"_n_oov_chars": 24523,
"oov_ratio": 0.026445281033008344,
"_oov_charset": "[\"a\", \"]\", \"③\", \"5\", \"n\", \" \", \"9\", \"⒀\", \"C\", \".\", \"⑩\", \"\", \")\", \"p\", \"t\", \"⑶\", \"-\", \"V\", \"4\", \"…\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"7\", \",\", \"h\", \"�\", \"・\", \"②\", \"⑸\", \":\", \"r\", \"3\", \"\\u0000\", \"+\", \"⒂\", \"e\", \"8\", \"⑨\", \"\\u0005\", \"&\", \"A\", \"\\b\", \"⑿\", \"\\u0006\", \"_\", \"2\", \" \", \"\", \"⑤\", \"?\", \",\", \"T\", \":\", \"0\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \";\", \"⒃\", \"⑦\", \"[\", \"i\", \"⒋\", \")\", \"6\", \""\", \"1\", \"\\u0007\", \"(\", \"(\", \"s\", \"!\", \"N\", \"④\"]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/ar": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/de": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"̈\", \"u\"]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/en": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen-7B-Chat @ cc100/es": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen-7B-Chat @ cc100/fa": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/fr": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/ja": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 463,
"oov_ratio": 0.000767744770464212,
"_oov_charset": "[\"と\", \"シ\", \"せ\", \"ハ\", \"す\", \"つ\", \"て\", \"゚\", \"ひ\", \"は\", \"フ\", \"へ\", \"か\", \"た\", \"し\", \"コ\", \"ス\", \"く\", \"ヒ\", \"ト\", \"゙\", \"ふ\", \"ホ\"]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/ko": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"累\", \"龍\", \"識\", \"理\", \"梁\", \"金\", \"女\", \"樂\", \"靈\", \"樂\", \"不\", \"流\", \"陸\", \"良\"]",
"reversible": false
},
"Qwen/Qwen-7B-Chat @ cc100/zh-Hans": {
"tokenizer": "Qwen",
"organization": "Alibaba",
"vocab_size": 151851,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B-Chat @ cc100/ar": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/de": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"̈\", \"u\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/en": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B-Chat @ cc100/es": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B-Chat @ cc100/fa": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/fr": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/ja": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 463,
"oov_ratio": 0.000767744770464212,
"_oov_charset": "[\"と\", \"シ\", \"せ\", \"ハ\", \"す\", \"つ\", \"て\", \"゚\", \"ひ\", \"は\", \"フ\", \"へ\", \"か\", \"た\", \"し\", \"コ\", \"ス\", \"く\", \"ヒ\", \"ト\", \"゙\", \"ふ\", \"ホ\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/ko": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"累\", \"龍\", \"識\", \"理\", \"梁\", \"金\", \"女\", \"樂\", \"靈\", \"樂\", \"不\", \"流\", \"陸\", \"良\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B-Chat @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/ar": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2813283,
"_n_tokens": 1422065,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/de": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1814876,
"_n_tokens": 527308,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/en": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1124813,
"_n_tokens": 284617,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/es": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1664455,
"_n_tokens": 482211,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/fa": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2054052,
"_n_tokens": 1145072,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/fr": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1540504,
"_n_tokens": 447233,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/ja": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1774770,
"_n_tokens": 593613,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/ko": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1524839,
"_n_tokens": 952744,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-Math @ cc100/zh-Hans": {
"tokenizer": "Skywork-13B-Math",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2633047,
"_n_tokens": 653923,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/ar": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2813283,
"_n_tokens": 1422065,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/de": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1814876,
"_n_tokens": 527308,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/en": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1124813,
"_n_tokens": 284617,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/es": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1664455,
"_n_tokens": 482211,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/fa": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2054052,
"_n_tokens": 1145072,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/fr": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1540504,
"_n_tokens": 447233,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/ja": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1774770,
"_n_tokens": 593613,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/ko": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 1524839,
"_n_tokens": 952744,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Skywork/Skywork-13B-base @ cc100/zh-Hans": {
"tokenizer": "Skywork-13B-base",
"organization": "Kunlun",
"vocab_size": 65519,
"_n_bytes": 2633047,
"_n_tokens": 653923,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm-6b @ cc100/ar": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2813283,
"_n_tokens": 1077200,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"\", \"…\", \"″\", \"\", \"\", \"�\", \"
\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"\", \"\", \"ﻷ\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/de": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1814876,
"_n_tokens": 569464,
"_n_chars": 1784021,
"_n_oov_chars": 524,
"oov_ratio": 0.0002937185156452755,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/en": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1124813,
"_n_tokens": 264761,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"�\", \"´\", \"‑\", \"⑧\", \"\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/es": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1664455,
"_n_tokens": 494848,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/fa": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2054052,
"_n_tokens": 890808,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"\", \"…\", \"\", \"\", \" \", \"�\", \"ﮧ\", \"\", \"\", \"\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/fr": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1540504,
"_n_tokens": 479261,
"_n_chars": 1484970,
"_n_oov_chars": 870,
"oov_ratio": 0.0005858704216246792,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/ja": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1774770,
"_n_tokens": 469930,
"_n_chars": 603065,
"_n_oov_chars": 7222,
"oov_ratio": 0.011975491862402892,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"つ\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"④\", \"し\", \"I\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"-\", \"V\", \"4\", \"て\", \"Z\", \"…\", \"¥\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"コ\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ホ\", \"ウ\", \"r\", \"せ\", \"3\", \"゚\", \"す\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"\\b\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"\", \"ス\", \"B\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \"T\", \"l\", \":\", \"0\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"゚\", \"ひ\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/ko": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 1524839,
"_n_tokens": 919630,
"_n_chars": 655190,
"_n_oov_chars": 1337,
"oov_ratio": 0.002040629435736199,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"*\", \"ㄷ\", \"@\", \"\", \"ㅜ\", \"?\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"․\", \"ㅝ\", \"Ⅱ\", \"ㄹ\", \"\", \"Ⅶ\", \"㏊\", \"Ⅵ\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"�\", \"②\", \"⑸\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"\", \"ㅢ\", \"ㅈ\", \"ㅋ\", \"㎡\", \"ㅑ\", \"梁\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"‥\", \" \", \"樂\", \"流\", \"\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"ㅆ\", \"ㅘ\", \":\", \"⑹\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"⑦\", \"ⅱ\", \"ⅰ\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"ㅎ\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"④\"]",
"reversible": false
},
"THUDM/chatglm-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm-6b",
"organization": "Tsinghua",
"vocab_size": 130344,
"_n_bytes": 2633047,
"_n_tokens": 507384,
"_n_chars": 927311,
"_n_oov_chars": 68481,
"oov_ratio": 0.07384901074181154,
"_oov_charset": "[\"a\", \" \", \"]\", \"③\", \"5\", \"n\", \" \", \"9\", \"⒀\", \"C\", \"?\", \".\", \"⑩\", \"\", \"p\", \"t\", \"⑶\", \"-\", \"V\", \"4\", \"…\", \"℃\", \"①\", \"o\", \"d\", \"⒁\", \"⑷\", \"D\", \"7\", \",\", \"h\", \"�\", \"・\", \"②\", \"⑸\", \"r\", \"3\", \"+\", \"⒂\", \"e\", \"8\", \"⑨\", \"\\u0005\", \"&\", \"A\", \"\\b\", \"⑿\", \"\\u0006\", \"_\", \"2\", \" \", \"\", \"⑤\", \"T\", \":\", \"0\", \"%\", \"⑥\", \"/\", \"⒌\", \"⑴\", \"⑧\", \"⒃\", \"⑦\", \"[\", \"i\", \"⒋\", \"!\", \")\", \"6\", \""\", \";\", \"1\", \"\\u0007\", \"(\", \"s\", \"N\", \"④\"]",
"reversible": false
},
"THUDM/chatglm2-6b @ cc100/ar": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/de": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1814876,
"_n_tokens": 619757,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/en": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1124813,
"_n_tokens": 269329,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/es": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1664455,
"_n_tokens": 546476,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/fa": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/fr": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1540504,
"_n_tokens": 495028,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/ja": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/ko": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 1524839,
"_n_tokens": 652156,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm2-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm2-6b",
"organization": "Tsinghua",
"vocab_size": 64787,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm3-6b @ cc100/ar": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm3-6b @ cc100/de": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1814876,
"_n_tokens": 619822,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"THUDM/chatglm3-6b @ cc100/en": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1124813,
"_n_tokens": 269347,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"THUDM/chatglm3-6b @ cc100/es": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1664455,
"_n_tokens": 546501,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"THUDM/chatglm3-6b @ cc100/fa": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm3-6b @ cc100/fr": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1540504,
"_n_tokens": 495052,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"THUDM/chatglm3-6b @ cc100/ja": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"THUDM/chatglm3-6b @ cc100/ko": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 1524839,
"_n_tokens": 652160,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"THUDM/chatglm3-6b @ cc100/zh-Hans": {
"tokenizer": "chatglm3-6b",
"organization": "Tsinghua",
"vocab_size": 64796,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ar": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2813283,
"_n_tokens": 1422070,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/de": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1814876,
"_n_tokens": 528918,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/en": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1124813,
"_n_tokens": 285652,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/es": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1664455,
"_n_tokens": 482553,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/fa": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2054052,
"_n_tokens": 1145046,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/fr": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1540504,
"_n_tokens": 447372,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ja": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1774770,
"_n_tokens": 567792,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/ko": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 1524839,
"_n_tokens": 793053,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-13b-chat-v2 @ cc100/zh-Hans": {
"tokenizer": "tigerbot-13b-chat-v2",
"organization": "Tigerobo",
"vocab_size": 60515,
"_n_bytes": 2633047,
"_n_tokens": 577385,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ar": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2813283,
"_n_tokens": 1422073,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/de": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1814876,
"_n_tokens": 529170,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/en": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1124813,
"_n_tokens": 286946,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/es": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1664455,
"_n_tokens": 484099,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/fa": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2054052,
"_n_tokens": 1145048,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/fr": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1540504,
"_n_tokens": 448567,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ja": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1774770,
"_n_tokens": 406571,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/ko": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 1524839,
"_n_tokens": 484082,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"TigerResearch/tigerbot-70b-chat-v4-4k @ cc100/zh-Hans": {
"tokenizer": "tigerbot-70b-chat-v4-4k",
"organization": "Tigerobo",
"vocab_size": 65110,
"_n_bytes": 2633047,
"_n_tokens": 577211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ar": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/de": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/en": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/es": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/fa": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/fr": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ja": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/ko": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Upstage/SOLAR-10.7B-v1.0 @ cc100/zh-Hans": {
"tokenizer": "SOLAR-10.7B-v1.0",
"organization": "-",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ar": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2813283,
"_n_tokens": 1195640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/de": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1814876,
"_n_tokens": 620541,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/en": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1124813,
"_n_tokens": 288965,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/es": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1664455,
"_n_tokens": 530592,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/fa": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2054052,
"_n_tokens": 851630,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/fr": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1540504,
"_n_tokens": 509958,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ja": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1774770,
"_n_tokens": 546876,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/ko": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 1524839,
"_n_tokens": 580873,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"WizardLM/WizardCoder-15B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardCoder-15B-V1.0",
"organization": "Microsoft",
"vocab_size": 49153,
"_n_bytes": 2633047,
"_n_tokens": 882018,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ar": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/de": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/en": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/es": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/fa": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/fr": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ja": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/ko": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardCoder-Python-7B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardCoder-Python-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ar": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/de": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/en": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/es": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/fa": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/fr": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ja": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/ko": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardLM-7B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardLM-7B-V1.0",
"organization": "Microsoft",
"vocab_size": 32001,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ar": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/de": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/en": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/es": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/fa": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/fr": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ja": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/ko": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"WizardLM/WizardMath-70B-V1.0 @ cc100/zh-Hans": {
"tokenizer": "WizardMath-70B-V1.0",
"organization": "Microsoft",
"vocab_size": 32002,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ar": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 2809195,
"_n_chars": 1560987,
"_n_oov_chars": 1250131,
"oov_ratio": 0.8008593281045903,
"_oov_charset": "[\"م\", \"©\", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"à\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"ذ\", \"خ\", \"“\", \"ۤ\", \"د\", \"۰\", \"٨\", \"τ\", \"▫\", \"®\", \"\", \"٦\", \"
\", \"ْ\", \"’\", \"ٌ\", \"😊\", \"ج\", \"█\", \"¡\", \"‹\", \"\", \"♥\", \"ن\", \"χ\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"”\", \"ئ\", \"٪\", \"پ\", \"ۗ\", \"ٹ\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"ك\", \"٢\", \"ٰ\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"μ\", \"—\", \"α\", \"١\", \"ö\", \"و\", \"é\", \"–\", \"\", \"»\", \"Х\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"‘\", \"٥\", \"ﻹ\", \"ـ\", \"«\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"ه\", \"ﻷ\", \"ؤ\", \"•\", \"أ\", \"ز\", \"٤\", \"ل\", \"ء\", \"ή\", \"″\", \"ä\", \"ص\", \"ّ\", \"ث\", \"η\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/de": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 1807780,
"_n_chars": 1784021,
"_n_oov_chars": 26647,
"oov_ratio": 0.01493648337099171,
"_oov_charset": "[\"©\", \"İ\", \"ς\", \"➔\", \" \", \"¿\", \"à\", \"☺\", \"ć\", \"·\", \"¼\", \"😃\", \"è\", \"\", \"\", \"Ø\", \"‚\", \"“\", \"😦\", \"τ\", \"û\", \"°\", \"å\", \"’\", \"ó\", \"€\", \"\", \"‹\", \"č\", \"£\", \"á\", \"♥\", \"−\", \"â\", \"”\", \"œ\", \"ç\", \"ε\", \"Ã\", \"ρ\", \"😉\", \"„\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"¹\", \"ú\", \"\", \"™\", \"ń\", \"½\", \"≠\", \"ί\", \"̈\", \"🙂\", \"♡\", \"😂\", \"↩\", \"—\", \"É\", \"α\", \"ι\", \"ö\", \"¬\", \"😈\", \"é\", \"–\", \"»\", \"ė\", \"›\", \"🙄\", \"Ö\", \"ü\", \"😆\", \"\", \"ø\", \"‘\", \"ß\", \"ā\", \"😢\", \"´\", \"ô\", \"«\", \"ớ\", \"\", \"Á\", \"•\", \"²\", \"¤\", \"\", \"š\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"♦\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/en": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 1121413,
"_n_chars": 1121360,
"_n_oov_chars": 1703,
"oov_ratio": 0.0015186915887850467,
"_oov_charset": "[\"—\", \"③\", \"¡\", \"£\", \"⑧\", \"¦\", \"\", \"•\", \"è\", \"⑦\", \"”\", \"‑\", \"é\", \"–\", \"»\", \"“\", \"😉\", \"ï\", \"®\", \"😥\", \"\", \"⑤\", \"‘\", \"ñ\", \"⑩\", \"\", \"\", \"´\", \"’\", \"\", \"«\", \"🙂\", \"ó\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/es": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 1658946,
"_n_chars": 1630297,
"_n_oov_chars": 31423,
"oov_ratio": 0.01927440214881092,
"_oov_charset": "[\"✓\", \"М\", \"©\", \"€\", \"′\", \"—\", \"É\", \"¡\", \"ý\", \"Á\", \"\", \"¿\", \"á\", \"️\", \"à\", \"ô\", \"ö\", \"•\", \"·\", \"í\", \"è\", \"²\", \"”\", \"é\", \"–\", \"\", \"▷\", \"»\", \"Í\", \"\", \"“\", \"😦\", \"😉\", \"ò\", \"ü\", \"🙁\", \"👍\", \"º\", \"®\", \"ª\", \"\", \"ø\", \"ñ\", \"Ñ\", \"‘\", \"°\", \"✪\", \"″\", \"ú\", \"✔\", \"\", \"―\", \"Ú\", \"👏\", \"´\", \"’\", \"«\", \"Ó\", \"🙂\", \"✖\", \"ó\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/fa": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 2036715,
"_n_chars": 1145876,
"_n_oov_chars": 899514,
"oov_ratio": 0.7850011694110008,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"ب\", \"·\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"“\", \"د\", \"۰\", \"٨\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"’\", \"۱\", \"ٴ\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"♥\", \"ن\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"”\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"ظ\", \"ح\", \"ت\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"–\", \"\", \"»\", \"ڪ\", \"›\", \"؛\", \"ב\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"‘\", \"٥\", \"٫\", \"ـ\", \"«\", \"ٍ\", \"ش\", \"س\", \"۷\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"ه\", \"ؤ\", \"•\", \"ز\", \"أ\", \"٤\", \"\", \"ل\", \"ء\", \"گ\", \"۴\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/fr": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 1524129,
"_n_chars": 1484970,
"_n_oov_chars": 47360,
"oov_ratio": 0.031892900193269895,
"_oov_charset": "[\"€\", \"—\", \"É\", \"♠\", \"Â\", \"à\", \"ô\", \"Î\", \"•\", \"·\", \"í\", \"è\", \"ù\", \"²\", \"À\", \"â\", \"̧\", \"℃\", \"ğ\", \"”\", \"́\", \"é\", \"µ\", \"œ\", \"–\", \"\", \"»\", \"ç\", \"ë\", \"î\", \"“\", \"😉\", \"ã\", \"ü\", \"Ê\", \"ï\", \"‐\", \"û\", \"®\", \"🤔\", \"♕\", \"\", \"°\", \"ê\", \"‘\", \"″\", \"
\", \"Ô\", \"ä\", \"™\", \"È\", \"―\", \"´\", \"’\", \"«\", \"̂\", \"Ç\", \"🙂\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ja": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 410803,
"_n_chars": 603065,
"_n_oov_chars": 1612,
"oov_ratio": 0.002673012030212332,
"_oov_charset": "[\"©\", \"ー\", \" \", \"③\", \"嶽\", \"兎\", \"ア\", \"ㅂ\", \"∀\", \"垠\", \"─\", \"✨\", \"〆\", \"ハ\", \"フ\", \"“\", \"゙\", \"๑\", \"嚥\", \"\", \"®\", \"曰\", \"ゞ\", \"欝\", \"〈\", \"Ⅱ\", \"⑩\", \"😭\", \"カ\", \"Ⅶ\", \"’\", \"*\", \"國\", \"😊\", \"⇒\", \"應\", \"冨\", \"彌\", \"龍\", \"−\", \"¥\", \"纒\", \"⑪\", \"🌙\", \"℃\", \"”\", \"①\", \"▷\", \"ヶ\", \"ε\", \"《\", \"︎\", \"\", \"◯\", \"ゥ\", \"澤\", \"‐\", \"﨑\", \"〇\", \"😌\", \"ロ\", \"Ⅹ\", \"※\", \"・\", \"②\", \"∇\", \"̈\", \"做\", \"♡\", \"゚\", \"μ\", \"—\", \"藁\", \"壬\", \"ヨ\", \"⇔\", \"و\", \"頬\", \"́\", \"。\", \"」\", \"o\", \"–\", \"»\", \"‼\", \"⻑\", \"㎞\", \"「\", \"💦\", \"舘\", \"コ\", \" \", \"\", \"̀\", \"-\", \"〉\", \"😢\", \"゙\", \"´\", \"⌒\", \"«\", \"嶋\", \"ィ\", \"ω\", \"〝\", \"屓\", \"メ\", \"リ\", \"》\", \"⑧\", \"〟\", \";\", \"叱\", \"•\", \"堺\", \"゚\", \"剥\", \"β\", \"`\", \" ̄\", \"レ\", \"♫\", \"渕\", \"填\", \";\", \"Д\", \"テ\", \"″\", \"―\", \"凛\", \"✧\", \"ノ\", \"ヘ\", \"、\", \"◡\", \"ウ\", \"④\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/ko": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 1512832,
"_n_chars": 655190,
"_n_oov_chars": 433188,
"oov_ratio": 0.6611639371785284,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"빈\", \"갈\", \"싱\", \"체\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"德\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"😂\", \"별\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"專\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"′\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"⑵\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"퍙\", \"루\", \"붐\", \"女\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"£\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"學\", \"툼\", \"컸\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"춘\", \"깔\", \"총\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"•\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"⬇\", \"멕\", \"↕\", \"않\", \"츈\", \"텁\", \"μ\", \"피\", \"읊\", \"명\", \"뿜\", \"흑\", \"딘\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"經\", \"♤\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"渴\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"션\", \"히\", \"벚\", \"歲\", \"’\", \"즙\", \"뺀\", \"쳤\", \"준\", \"얏\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"±\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"깨\", \"솨\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"겹\", \"엉\", \"룰\", \"녘\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"급\", \"누\", \"밟\", \"셰\", \"©\", \"戊\", \"맷\", \"💥\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"문\", \"✔\", \"군\", \"픔\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"자\", \"널\", \"눅\", \"의\", \"〈\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"볍\", \"國\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"훨\", \"걸\", \"돠\", \"🌵\", \"서\", \"숭\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"α\", \"앰\", \"림\", \"혹\", \"»\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"〉\", \"왘\", \"흄\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"敎\", \"냉\", \"힙\", \"팽\", \"헝\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"넌\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"몸\", \"쥬\", \"—\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"톨\", \"냈\", \"푸\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"‘\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"툰\", \"쏠\", \"맵\", \"싫\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"챗\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"㉰\", \"본\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"《\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"ω\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"🙌\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"”\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"뜩\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"⑴\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"납\", \"므\", \"릉\", \"發\", \"텅\", \"우\", \"켐\", \"펠\", \"“\", \"랐\", \"습\", \"®\", \"강\", \"뛸\", \"색\", \"쌈\", \"€\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"》\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"🍎\", \"내\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"ᴀ\", \"놔\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"짊\", \"㏊\", \"젊\", \"將\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"큰\", \"폿\", \"옐\", \"징\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"게\", \"탬\", \"숨\", \"축\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"·\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"≤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"對\", \"삼\", \"착\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"」\", \"Ⅸ\", \"웹\", \"뤘\", \"龍\", \"팍\", \"곁\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"飮\", \"마\", \"탁\", \"內\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"abeja/gpt-neox-japanese-2.7b @ cc100/zh-Hans": {
"tokenizer": "gpt-neox-japanese-2.7b",
"organization": "ABEJA",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1049033,
"_n_chars": 927311,
"_n_oov_chars": 165802,
"oov_ratio": 0.17879869860273415,
"_oov_charset": "[\"嘎\", \"腾\", \"\", \"叨\", \"鱼\", \"⒀\", \"撬\", \"赌\", \"蕤\", \"皂\", \"湄\", \"當\", \"训\", \"玷\", \"词\", \"挈\", \"页\", \"吆\", \"\", \"贵\", \"贱\", \"德\", \"杆\", \"吮\", \"呸\", \"脯\", \"术\", \"谔\", \"尴\", \"继\", \"蒂\", \"蝌\", \"吱\", \"啤\", \"级\", \"蹦\", \"旖\", \"懂\", \"睹\", \"锡\", \"戍\", \"纱\", \"贴\", \"⒁\", \"渗\", \"饥\", \"聪\", \"蹩\", \"渐\", \"掂\", \"・\", \"⑸\", \"浏\", \"侣\", \"筷\", \"劑\", \"咦\", \"肿\", \"诀\", \"敛\", \"斩\", \"佬\", \"挣\", \"擘\", \"耩\", \"滚\", \"摧\", \"畴\", \"吴\", \"⑨\", \"灿\", \"泠\", \"调\", \"蓦\", \"谋\", \"哧\", \"项\", \"滢\", \"曦\", \"搡\", \"缉\", \"闹\", \"辄\", \"袒\", \"钦\", \"坯\", \"怎\", \"际\", \"谱\", \"锻\", \"氛\", \"揽\", \"佟\", \"质\", \"牺\", \"蓝\", \"漩\", \"填\", \"驳\", \"坷\", \"么\", \"妈\", \"―\", \"聆\", \"垒\", \"树\", \"这\", \"贫\", \"镏\", \"证\", \"冲\", \"菇\", \"荆\", \"挚\", \"楂\", \"闸\", \"离\", \"鬓\", \"记\", \"砸\", \"冈\", \"赃\", \"擞\", \"诶\", \"窿\", \"τ\", \"眨\", \"倨\", \"牵\", \"媳\", \"颌\", \"厌\", \"帘\", \"苇\", \"护\", \"氰\", \"窜\", \"愤\", \"驴\", \"诱\", \"丽\", \"黑\", \"软\", \"①\", \"邓\", \"椭\", \"遴\", \"惮\", \"业\", \"迈\", \"众\", \"哪\", \"鹰\", \"赏\", \"筛\", \"笋\", \"轻\", \"节\", \"雏\", \"删\", \"萝\", \"赅\", \"濒\", \"蛊\", \"顿\", \"润\", \"镀\", \"册\", \"风\", \"缩\", \"〖\", \"揍\", \"陡\", \"库\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"珏\", \"惦\", \"呐\", \"峥\", \"尔\", \"挠\", \"紧\", \"拯\", \"亵\", \"县\", \"偿\", \"衬\", \"撐\", \"检\", \"黏\", \"黧\", \"圆\", \"烬\", \"姣\", \"黩\", \"荨\", \"见\", \"踩\", \"闭\", \"炕\", \"笃\", \"找\", \"闻\", \"矗\", \"粱\", \"瘾\", \"罩\", \"岚\", \"據\", \"绍\", \"奂\", \"惬\", \"凉\", \"缥\", \"艋\", \"睐\", \"戳\", \"戾\", \"冯\", \"顺\", \"阀\", \"帕\", \"侧\", \"狱\", \"盖\", \"陈\", \"辉\", \"邬\", \"汩\", \"钩\", \"甯\", \"刘\", \"药\", \"钥\", \"忆\", \"镭\", \"嘻\", \"俞\", \"祛\", \"队\", \"沉\", \"颈\", \"锥\", \"烘\", \"陆\", \"憨\", \"荟\", \"芃\", \"喔\", \"庙\", \"樱\", \"惩\", \"贬\", \"轰\", \"竭\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"痫\", \"识\", \"瘠\", \"书\", \"跃\", \"耙\", \"抿\", \"蟑\", \"歼\", \"酿\", \"诨\", \"萦\", \"龟\", \"雯\", \"验\", \"耀\", \"阽\", \"鲎\", \"痊\", \"远\", \"绣\", \"开\", \"篮\", \"鸭\", \"彻\", \"墅\", \"练\", \"荫\", \"咱\", \"张\", \"姗\", \"嘟\", \"盎\", \"愣\", \"悚\", \"梭\", \"驮\", \"喷\", \"响\", \"桥\", \"玫\", \"〝\", \"俩\", \"瑒\", \"终\", \"•\", \"毋\", \"尝\", \"砍\", \"挤\", \"荣\", \"疮\", \"鹌\", \"笼\", \"诊\", \"铜\", \"扛\", \"赣\", \"撅\", \"邻\", \"份\", \"蓟\", \" \", \"郸\", \"锄\", \"逾\", \"垠\", \"壳\", \"庐\", \"梦\", \"沾\", \"增\", \"饰\", \"Ø\", \"强\", \"窥\", \"辗\", \"陕\", \"咕\", \"懑\", \"驼\", \"暧\", \"缓\", \"闪\", \"疴\", \"歉\", \"窗\", \"衔\", \"产\", \"鹈\", \"ὐ\", \"镜\", \"胁\", \"骆\", \"孽\", \"赋\", \"冰\", \"轮\", \"阵\", \"阔\", \"巅\", \"亟\", \"岌\", \"谩\", \"债\", \"聒\", \"圣\", \"丧\", \"插\", \"跤\", \"镳\", \"噱\", \"热\", \"谴\", \"伦\", \"劝\", \"啥\", \"凤\", \"驰\", \"陷\", \"惕\", \"孀\", \"违\", \"馍\", \"咐\", \"庆\", \"场\", \"竞\", \"绑\", \"氮\", \"巢\", \"诵\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"划\", \"锅\", \"卷\", \"棵\", \"观\", \"哟\", \"缚\", \"洼\", \"贼\", \"铸\", \"剑\", \"剂\", \"欸\", \"弹\", \"歹\", \"备\", \"鲜\", \"桌\", \"纾\", \"饼\", \"趋\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"渎\", \"扑\", \"莲\", \"抬\", \"铁\", \"层\", \"睽\", \"浠\", \"两\", \"陇\", \"秽\", \"犄\", \"谐\", \"假\", \"赵\", \"铛\", \"耸\", \"⑩\", \"’\", \"腭\", \"苒\", \"剐\", \"乒\", \"莘\", \"螃\", \"揭\", \"嘈\", \"旆\", \"纬\", \"栅\", \"胶\", \"魇\", \"杨\", \"摆\", \"毁\", \"旎\", \"逛\", \"谜\", \"汇\", \"蜒\", \"\", \"兢\", \"绳\", \"炖\", \"躺\", \"邮\", \"绘\", \"乓\", \"诅\", \"飘\", \"尬\", \"磺\", \"嗨\", \"辐\", \"录\", \"缝\", \"摊\", \"權\", \"结\", \"覃\", \"睿\", \"鹃\", \"霭\", \"撷\", \"喽\", \"磕\", \"撕\", \"审\", \"赠\", \"邹\", \"营\", \"宪\", \"赢\", \"嚣\", \"潇\", \"赘\", \"逑\", \"拣\", \"崽\", \"题\", \"拖\", \"佘\", \"础\", \"达\", \"掰\", \"挲\", \"〗\", \"谢\", \"粼\", \"杀\", \"遗\", \"囊\", \"辑\", \"夺\", \"蹒\", \"兑\", \"瘦\", \"须\", \"读\", \"馋\", \"弃\", \"稻\", \"腻\", \"坠\", \"盹\", \"羔\", \"犹\", \"榄\", \"默\", \"泻\", \"币\", \"讦\", \"④\", \"丢\", \"翕\", \"牠\", \"飙\", \"饨\", \"骤\", \"较\", \"阑\", \"惯\", \"侬\", \"灶\", \"靓\", \"靶\", \"垮\", \"晚\", \"氨\", \"鸥\", \"朵\", \"呗\", \"骛\", \"职\", \"樯\", \"负\", \"瞧\", \"咔\", \"讳\", \"嘤\", \"嘛\", \"诣\", \"谣\", \"严\", \"颉\", \"睑\", \"骏\", \"芷\", \"铝\", \"鹅\", \"毕\", \"谓\", \"莓\", \"粪\", \"涤\", \"烦\", \"凯\", \"茏\", \"趁\", \"聋\", \"℃\", \"疯\", \"瓷\", \"荧\", \"轴\", \"毡\", \"懵\", \"忪\", \"„\", \"罚\", \"纺\", \"捡\", \"效\", \"茵\", \"蓁\", \"执\", \"铂\", \"瞩\", \"险\", \"铨\", \"惴\", \"圈\", \"构\", \"萧\", \"嵘\", \"亂\", \"肤\", \"踢\", \"尧\", \"导\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"厂\", \"郜\", \"汤\", \"勋\", \"颖\", \"ê\", \"骇\", \"账\", \"盯\", \"显\", \"儿\", \"瑄\", \"缀\", \"决\", \"⒌\", \"俱\", \"吩\", \"铃\", \"ù\", \"瑢\", \"过\", \"链\", \"璀\", \"讨\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"剧\", \"摔\", \"览\", \"棱\", \"洁\", \"哗\", \"抢\", \"©\", \"寻\", \"咪\", \"苹\", \"膛\", \"萨\", \"镑\", \"嗡\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"擀\", \"呦\", \"估\", \"值\", \"辫\", \"岛\", \"坚\", \"饶\", \"莺\", \"绊\", \"暨\", \"驱\", \"击\", \"晓\", \"锁\", \"厮\", \"纷\", \"婶\", \"纲\", \"劲\", \"扪\", \"骁\", \"锌\", \"补\", \"氧\", \"岗\", \"缄\", \"亩\", \"伞\", \"遢\", \"丐\", \"馆\", \"跑\", \"怀\", \"叼\", \"惋\", \"狳\", \"挎\", \"绽\", \"辈\", \"计\", \"碳\", \"冻\", \"涡\", \"瞎\", \"枪\", \"é\", \"淅\", \"钉\", \"⑿\", \"胫\", \"祢\", \"瓣\", \"报\", \"诚\", \"骼\", \"雾\", \"纽\", \"亿\", \"\", \"户\", \"阱\", \"戏\", \"黢\", \"爰\", \"觉\", \"娄\", \"预\", \"躲\", \"剥\", \"簇\", \"抖\", \"惘\", \"賣\", \"娇\", \"陨\", \"啬\", \"铲\", \"唬\", \"颇\", \"矶\", \"剁\", \"帅\", \"韩\", \"岂\", \"鸟\", \"兹\", \"浓\", \"辽\", \"碰\", \"艺\", \"查\", \"摄\", \"霉\", \"农\", \"侥\", \"盼\", \"济\", \"扰\", \"歧\", \"辙\", \"鼯\", \"缸\", \"极\", \"屣\", \"译\", \"谁\", \"馁\", \"觑\", \"靛\", \"铤\", \"甩\", \"俏\", \"妆\", \"贾\", \"〈\", \"摞\", \"霸\", \"郴\", \"异\", \"狞\", \"蛔\", \"粹\", \"铄\", \"处\", \"擎\", \"优\", \"á\", \"凿\", \"飞\", \"吓\", \"烂\", \"抠\", \"穰\", \"璨\", \"忧\", \"妇\", \"伤\", \"碎\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"婊\", \"绒\", \"疤\", \"搁\", \"课\", \"扳\", \"斋\", \"做\", \"峭\", \"销\", \"阂\", \"α\", \"胀\", \"论\", \"怵\", \"灭\", \"纹\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"汛\", \"苍\", \"颤\", \"壑\", \"诃\", \"»\", \"酝\", \"赖\", \"蔼\", \"睁\", \"鹤\", \"缔\", \"阐\", \" \", \"厅\", \"〉\", \"犁\", \"鸩\", \"瘀\", \"线\", \"栋\", \"讥\", \"俪\", \"⑧\", \"另\", \"环\", \"胳\", \"鲤\", \"拂\", \"柜\", \"韵\", \"卢\", \"楞\", \"龄\", \"齿\", \"袭\", \"闾\", \"窝\", \"诸\", \"姆\", \"则\", \"惊\", \"拽\", \"悯\", \"败\", \"谛\", \"擤\", \"ς\", \"③\", \"琐\", \"沥\", \"别\", \"锲\", \"噼\", \"鸠\", \"罄\", \"搅\", \"捍\", \"暄\", \"淌\", \"榆\", \"碱\", \"漪\", \"厢\", \"嘣\", \"皱\", \"恺\", \"煲\", \"栈\", \"壤\", \"傻\", \"寰\", \"馕\", \"籁\", \"杰\", \"诩\", \"啡\", \"趟\", \"扔\", \"澜\", \"啕\", \"墙\", \"烧\", \"磅\", \"钧\", \"嗲\", \"脸\", \"锤\", \"讪\", \"氢\", \"适\", \"玛\", \"讲\", \"髓\", \"卻\", \"垃\", \"馒\", \"耍\", \"槛\", \"厕\", \"赞\", \"—\", \"竖\", \"针\", \"贝\", \"袜\", \"赔\", \"绞\", \"拨\", \"扎\", \"泾\", \"\", \"墉\", \"吭\", \"屉\", \"龚\", \"颧\", \"锏\", \"踹\", \"‘\", \"涣\", \"标\", \"颂\", \"熙\", \"泪\", \"篡\", \"涌\", \"羡\", \"铩\", \"贡\", \"旳\", \"每\", \"选\", \"钝\", \"ο\", \"萤\", \"诉\", \"溯\", \"嚷\", \"瑧\", \"约\", \"癜\", \"噩\", \"脑\", \"绉\", \"娴\", \"诈\", \"谧\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"扣\", \"锂\", \"捂\", \"肮\", \"闯\", \"藏\", \"怕\", \"诠\", \"瞟\", \"桢\", \"叠\", \"窍\", \"吊\", \"斌\", \"炅\", \"涉\", \"刚\", \"攥\", \"纤\", \"牖\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"兴\", \"篷\", \"硕\", \"纪\", \"崛\", \"哒\", \"释\", \"浇\", \"伫\", \"溪\", \"囤\", \"掀\", \"银\", \"鸦\", \"认\", \"蚪\", \"楣\", \"匆\", \"脖\", \"虽\", \"俨\", \"镉\", \"欢\", \"办\", \"涩\", \"迹\", \"跻\", \"攒\", \"诟\", \"臊\", \"î\", \"《\", \"减\", \"\", \"掐\", \"圩\", \"墒\", \"确\", \"栾\", \"恿\", \"畅\", \"砾\", \"甬\", \"炼\", \"芜\", \"亲\", \"耦\", \"猝\", \"蹭\", \"贤\", \"哑\", \"纰\", \"眶\", \"荡\", \"单\", \"车\", \"倾\", \"醛\", \"卫\", \"壹\", \"赡\", \"舍\", \"妞\", \"购\", \"晕\", \"勖\", \"棂\", \"诧\", \"轩\", \"仑\", \"售\", \"扒\", \"偎\", \"π\", \"坟\", \"炝\", \"载\", \"匾\", \"锋\", \"裳\", \"呕\", \"娛\", \"逊\", \"⑦\", \"块\", \"谍\", \"诲\", \"價\", \"莴\", \"偷\", \"泵\", \"谬\", \"舆\", \"肃\", \"军\", \"疗\", \"凛\", \"锚\", \"瑨\", \"∶\", \"蘑\", \"碟\", \"编\", \"篓\", \"灵\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"缪\", \"咏\", \"贷\", \"帜\", \"弈\", \"胧\", \"骅\", \"艰\", \"呜\", \"浞\", \"晖\", \"驶\", \"驿\", \"乔\", \"转\", \"宠\", \"习\", \"桩\", \"积\", \"夯\", \"踌\", \"翘\", \"媲\", \"郑\", \"锒\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"膊\", \"辅\", \"饷\", \"”\", \"钊\", \"倘\", \"呃\", \"孪\", \"衅\", \"烃\", \"溃\", \"搂\", \"涨\", \"凳\", \"义\", \"臃\", \"栏\", \"茁\", \"恶\", \"硅\", \"笆\", \"综\", \"讷\", \"滨\", \"净\", \"阴\", \"谦\", \"锐\", \"规\", \"奋\", \"鳌\", \"爸\", \"暂\", \"蚂\", \"恼\", \"鸡\", \"觅\", \"钓\", \"喱\", \"\", \"亚\", \"喻\", \"让\", \"骄\", \"喆\", \"赂\", \"兰\", \"夹\", \"麽\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"⑴\", \"收\", \"飕\", \"怔\", \"遛\", \"况\", \"组\", \"货\", \"纠\", \"敌\", \"玳\", \"够\", \"俭\", \"织\", \"价\", \"哎\", \"骑\", \"钱\", \"沧\", \"淖\", \"皈\", \"吕\", \"权\", \"翱\", \"愿\", \" \", \"汹\", \"發\", \"摒\", \"辨\", \"湮\", \"─\", \"贮\", \"鹏\", \"宽\", \"带\", \"访\", \"“\", \"踱\", \"浆\", \"稳\", \"颐\", \"边\", \"婴\", \"辩\", \"柠\", \"韧\", \"钮\", \"谅\", \"虏\", \"豫\", \"蚌\", \"议\", \"扯\", \"嘿\", \"澈\", \"夸\", \"鹜\", \"壓\", \"评\", \"拢\", \"择\", \"脐\", \"岁\", \"忑\", \"临\", \"咚\", \"询\", \"缴\", \"图\", \"伪\", \"伉\", \"舰\", \"诫\", \"旷\", \"\", \"曾\", \"丫\", \"拦\", \"狮\", \"满\", \"掳\", \"缭\", \"绸\", \"瑥\", \"丝\", \"镶\", \"镕\", \"趴\", \"坝\", \"馅\", \"蚀\", \"聂\", \"啪\", \"骚\", \"谈\", \"蜕\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"矿\", \"摇\", \"喂\", \"浊\", \"绷\", \"唉\", \"剔\", \"》\", \"缺\", \"唤\", \"涂\", \"⒃\", \"慷\", \"财\", \"嘭\", \"韦\", \"瞄\", \"婪\", \"启\", \"锦\", \"猎\", \"搀\", \"榷\", \"坛\", \"缮\", \"瘙\", \"號\", \"惠\", \"矫\", \"钵\", \"还\", \"褂\", \"您\", \"抡\", \"薯\", \"传\", \"°\", \"贸\", \"颜\", \"归\", \"秆\", \"惶\", \"侨\", \"惫\", \"ě\", \"鹑\", \"柬\", \"爹\", \"孱\", \"协\", \"蜡\", \"跷\", \"吵\", \"盏\", \"遑\", \"馈\", \"误\", \"颓\", \"谚\", \"阅\", \"关\", \"挡\", \"闫\", \"专\", \"盐\", \"纳\", \"烯\", \"屄\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"撩\", \"橱\", \"仆\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"⒂\", \"鸣\", \"焯\", \"骗\", \"厉\", \"脏\", \"缅\", \"窦\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"鲸\", \"铺\", \"圾\", \"嗪\", \"屿\", \"戛\", \"贞\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"驻\", \"损\", \"哦\", \"污\", \"簧\", \"拥\", \"岔\", \"纨\", \"颊\", \"咙\", \"闺\", \"诙\", \"绥\", \"赶\", \"档\", \"盘\", \"刨\", \"鳃\", \"荐\", \"侄\", \"滥\", \"拧\", \"辖\", \"撸\", \"缈\", \"砖\", \"沦\", \"醉\", \"夭\", \"晗\", \"毙\", \"烁\", \"厝\", \"续\", \"饱\", \"给\", \"舱\", \"扭\", \"仿\", \"泼\", \"举\", \"错\", \"蹿\", \"抚\", \"仪\", \"沟\", \"掺\", \"肾\", \"滩\", \"莹\", \"榭\", \"猬\", \"势\", \"韪\", \"换\", \"轼\", \"瞅\", \"逻\", \"鸽\", \"闵\", \"坞\", \"垛\", \"姊\", \"臻\", \"祸\", \"帮\", \"掷\", \"驭\", \"霾\", \"轶\", \"肠\", \"唏\", \"听\", \"檐\", \"荤\", \"迩\", \"阶\", \"扫\", \"毗\", \"缠\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"–\", \"舔\", \"鹕\", \"资\", \"烷\", \"钢\", \"谊\", \"沪\", \"镍\", \"钰\", \"贯\", \"姐\", \"阎\", \"▪\", \"憋\", \"姬\", \"汉\", \"费\", \"运\", \"澡\", \"嗯\", \"啦\", \"从\", \"搐\", \"琼\", \"连\", \"狰\", \"咧\", \"帐\", \"屌\", \"闷\", \"痹\", \"虾\", \"渔\", \"顾\", \"霏\", \"缜\", \"仓\", \"岭\", \"绛\", \"颗\", \"骂\", \"蕴\", \"舀\", \"阁\", \"惭\", \"浑\", \"礴\", \"匮\", \"奖\", \"态\", \"谨\", \"创\", \"捅\", \"顷\", \"鲨\", \"灾\", \"桦\", \"匀\", \"顽\", \"·\", \"艳\", \"锣\", \"撇\", \"庞\", \"忡\", \"顶\", \"铎\", \"赚\", \"阳\", \"师\", \"狠\", \"薰\", \"曰\", \"氯\", \"赁\", \"锈\", \"拔\", \"馏\", \"韫\", \"啃\", \"疙\", \"寐\", \"絮\", \"绚\", \"鹉\", \"焕\", \"妒\", \"历\", \"缕\", \"颁\", \"佝\", \"莅\", \"锢\", \"彤\", \"稣\", \"ç\", \"沏\", \"买\", \"谆\", \"侦\", \"潢\", \"鸿\", \"倡\", \"跚\", \"瑑\", \"团\", \"※\", \"犷\", \"你\", \"讯\", \"试\", \"睬\", \"废\", \"撑\", \"养\", \"缘\", \"雳\", \"亏\", \"胜\", \"诬\", \"韬\", \"犰\", \"绰\", \"嫖\", \"鲍\", \"饿\", \"贩\", \"捆\", \"烊\", \"嗦\", \"痪\", \"捞\", \"煞\", \"获\", \"隐\", \"倜\", \"闲\", \"丛\", \"焊\", \"缆\", \"输\", \"伙\", \"联\", \"肓\", \"钞\", \"悬\", \"驾\", \"绵\", \"签\", \"穗\", \"溉\", \"摹\", \"瞪\", \"绕\", \"储\", \"罢\", \"垫\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"抨\", \"劳\", \"岖\", \"逶\", \"粮\", \"绝\", \"羁\", \"哇\", \"藕\", \"卖\", \"à\", \"胺\", \"啸\", \"饭\", \"蜿\", \"玮\", \"溅\", \"诡\", \"渲\", \"馄\", \"涮\", \"秃\", \"挖\", \"吨\", \"拜\", \"镇\", \"眯\", \"领\", \"许\", \"穷\", \"渍\", \"晤\", \"秸\", \"⑶\", \"挝\", \"伟\", \"键\", \"泽\", \"湃\", \"籽\", \"烟\", \"懒\", \"乡\", \"详\", \"铣\", \"讼\", \"筝\", \"烤\", \"藐\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"搜\", \"卤\", \"滤\", \"责\", \"娱\", \"钟\", \"偻\", \"饵\", \"鳞\", \"细\", \"齐\", \"镐\", \"笨\", \"孙\", \"焰\", \"酱\", \"谑\", \"测\", \"压\", \"脉\", \"瞒\", \"ό\", \"叮\", \"垄\", \"茧\", \"呛\", \"迤\", \"⑤\", \"佣\", \"瓜\", \"鹭\", \"塌\", \"赎\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"唷\", \"鳗\", \"杂\", \"鉴\", \"红\", \"桅\", \"娅\", \"裹\", \"熬\", \"⒋\", \"飓\", \"饮\", \"凑\", \"碴\", \"嗓\", \"內\", \"辕\", \"视\", \"马\", \"皑\", \"醋\", \"哥\", \"挥\", \"嘀\", \"鲁\", \"谭\", \"谎\", \"烛\", \"圜\"]",
"reversible": false
},
"ai21labs/Jamba-v0.1 @ cc100/ar": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2813283,
"_n_tokens": 717886,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/de": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1814876,
"_n_tokens": 525856,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/en": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1124813,
"_n_tokens": 264242,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/es": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1664455,
"_n_tokens": 410883,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/fa": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2054052,
"_n_tokens": 722550,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/fr": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1540504,
"_n_tokens": 402899,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/ja": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1774770,
"_n_tokens": 673256,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/ko": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 1524839,
"_n_tokens": 705688,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ai21labs/Jamba-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Jamba-v0.1",
"organization": "AI21",
"vocab_size": 65536,
"_n_bytes": 2633047,
"_n_tokens": 1057054,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"allenai/OLMo-7B @ cc100/ar": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2813283,
"_n_tokens": 1106277,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/de": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1814876,
"_n_tokens": 583628,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"̈\", \"u\"]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/en": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1124813,
"_n_tokens": 259357,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/es": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1664455,
"_n_tokens": 494577,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/fa": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2054052,
"_n_tokens": 866434,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/fr": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1540504,
"_n_tokens": 458961,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/ja": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1774770,
"_n_tokens": 605168,
"_n_chars": 603065,
"_n_oov_chars": 465,
"oov_ratio": 0.0007710611625612496,
"_oov_charset": "[\"と\", \"シ\", \"せ\", \"ハ\", \" \", \"す\", \"つ\", \"て\", \"゚\", \"ひ\", \"は\", \"フ\", \"へ\", \"か\", \"た\", \"し\", \"コ\", \"ス\", \"く\", \"ヒ\", \"ト\", \"゙\", \"ふ\", \"ホ\"]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/ko": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 1524839,
"_n_tokens": 973288,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"立\", \"累\", \"龍\", \"識\", \"理\", \"梁\", \"金\", \"女\", \"樂\", \"靈\", \"樂\", \"不\", \"流\", \"陸\", \"良\"]",
"reversible": false
},
"allenai/OLMo-7B @ cc100/zh-Hans": {
"tokenizer": "OLMo-7B",
"organization": "Allen AI",
"vocab_size": 50280,
"_n_bytes": 2633047,
"_n_tokens": 1220529,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/ar": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2813283,
"_n_tokens": 1422976,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"\", \"…\", \"″\", \"\", \"\", \"�\", \"
\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"\", \"\", \"ﻷ\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/de": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1814876,
"_n_tokens": 680512,
"_n_chars": 1784021,
"_n_oov_chars": 524,
"oov_ratio": 0.0002937185156452755,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/en": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1124813,
"_n_tokens": 280108,
"_n_chars": 1121360,
"_n_oov_chars": 77,
"oov_ratio": 6.866661910537205e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"�\", \"´\", \"‑\", \"⑧\", \"\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/es": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1664455,
"_n_tokens": 585804,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/fa": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2054052,
"_n_tokens": 1142057,
"_n_chars": 1145876,
"_n_oov_chars": 7649,
"oov_ratio": 0.006675242347339502,
"_oov_charset": "[\"\", \"…\", \"\", \"\", \"�\", \"ﮧ\", \"\", \"\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/fr": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1540504,
"_n_tokens": 540430,
"_n_chars": 1484970,
"_n_oov_chars": 870,
"oov_ratio": 0.0005858704216246792,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/ja": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1774770,
"_n_tokens": 591656,
"_n_chars": 603065,
"_n_oov_chars": 3814,
"oov_ratio": 0.006324359729050766,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \"③\", \"n\", \"つ\", \"*\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"し\", \"I\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"-\", \"V\", \"て\", \"Z\", \"…\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"コ\", \"F\", \"ゥ\", \">\", \"\\u001b\", \"m\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ホ\", \"ウ\", \"r\", \"せ\", \"゚\", \"す\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"\\b\", \"㎞\", \"「\", \"_\", \"J\", \"コ\", \"‥\", \" \", \"\", \"ス\", \"B\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \"T\", \"l\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"゚\", \"ひ\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \")\", \";\", \"テ\", \"″\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"④\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/ko": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 1524839,
"_n_tokens": 639258,
"_n_chars": 655190,
"_n_oov_chars": 1330,
"oov_ratio": 0.002029945511988889,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"*\", \"ㄷ\", \"@\", \"\", \"ㅜ\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"․\", \"ㅝ\", \"Ⅱ\", \"ㄹ\", \"\", \"Ⅶ\", \"㏊\", \"Ⅵ\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"�\", \"②\", \"⑸\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"ㅢ\", \"ㅈ\", \"ㅋ\", \"㎡\", \"ㅑ\", \"梁\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"‥\", \" \", \"樂\", \"流\", \"\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"ㅆ\", \"ㅘ\", \"⑹\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"⑦\", \"ⅱ\", \"ⅰ\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"ㅎ\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"④\"]",
"reversible": false
},
"baichuan-inc/Baichuan-7B @ cc100/zh-Hans": {
"tokenizer": "baichuan",
"organization": "Baichuan",
"vocab_size": 64000,
"_n_bytes": 2633047,
"_n_tokens": 626117,
"_n_chars": 927311,
"_n_oov_chars": 24162,
"oov_ratio": 0.026055983375588124,
"_oov_charset": "[\"a\", \"r\", \"%\", \"]\", \"③\", \"⑶\", \"⑥\", \"/\", \"-\", \"n\", \" \", \"⒌\", \"⑴\", \"⑧\", \"V\", \"+\", \"⒂\", \"⒀\", \"C\", \"…\", \"⒃\", \"e\", \"⑦\", \"⑨\", \"[\", \"℃\", \"\\u0005\", \"①\", \"&\", \"o\", \"i\", \"d\", \"A\", \"⒋\", \"\\b\", \"⑿\", \".\", \"⑷\", \"⒁\", \")\", \"\\u0006\", \"D\", \"_\", \""\", \";\", \" \", \"\", \"⑤\", \"\\u0007\", \"\", \"(\", \"⑩\", \"�\", \"s\", \"h\", \"・\", \"②\", \"⑸\", \"p\", \"T\", \"t\", \"N\", \"④\"]",
"reversible": false
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ar": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2813283,
"_n_tokens": 1337285,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/de": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1814876,
"_n_tokens": 628063,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/en": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1124813,
"_n_tokens": 269011,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/es": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1664455,
"_n_tokens": 551326,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/fa": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2054052,
"_n_tokens": 1052077,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/fr": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1540504,
"_n_tokens": 512313,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ja": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1774770,
"_n_tokens": 554936,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/ko": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 1524839,
"_n_tokens": 623358,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"baichuan-inc/Baichuan2-7B-Chat @ cc100/zh-Hans": {
"tokenizer": "baichuan2",
"organization": "Baichuan",
"vocab_size": 125696,
"_n_bytes": 2633047,
"_n_tokens": 541464,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/ar": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2813283,
"_n_tokens": 427489,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/de": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1814876,
"_n_tokens": 541170,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/en": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1124813,
"_n_tokens": 257405,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/es": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1664455,
"_n_tokens": 350793,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/fa": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2054052,
"_n_tokens": 434406,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/fr": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1540504,
"_n_tokens": 321639,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/ja": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1774770,
"_n_tokens": 523592,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/ko": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 1524839,
"_n_tokens": 742111,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"bigscience/bloom @ cc100/zh-Hans": {
"tokenizer": "bloom",
"organization": "BigScience",
"vocab_size": 250680,
"_n_bytes": 2633047,
"_n_tokens": 573008,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"ckiplab/gpt2-base-chinese @ cc100/ar": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2813283,
"_n_tokens": 597677,
"_n_chars": 1560987,
"_n_oov_chars": 374419,
"oov_ratio": 0.2398604216434858,
"_oov_charset": "[\"م\", \"u\", \" \", \"۲\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"G\", \"9\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"“\", \"×\", \"د\", \"ۤ\", \"۰\", \"d\", \"٨\", \"X\", \"▫\", \"i\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"’\", \"a\", \"ٌ\", \"😊\", \"ج\", \"I\", \"h\", \"¡\", \"m\", \"\", \"…\", \"ن\", \"7\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"”\", \"ئ\", \"٪\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"—\", \"v\", \"S\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"o\", \"–\", \"\", \"k\", \"Х\", \"﴿\", \"؛\", \"Q\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"ش\", \"س\", \"٣\", \"V\", \"٧\", \"۷\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"B\", \"P\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"ä\", \"ص\", \"ّ\", \"ث\", \"n\", \"4\", \"Z\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/de": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1814876,
"_n_tokens": 766497,
"_n_chars": 1784021,
"_n_oov_chars": 112934,
"oov_ratio": 0.06330306649977775,
"_oov_charset": "[\"¶\", \"İ\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"à\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"x\", \"Ø\", \"😀\", \"‚\", \"“\", \"😦\", \"y\", \"X\", \"û\", \"H\", \"å\", \"’\", \"ó\", \"I\", \"h\", \"\", \"č\", \"á\", \"…\", \"â\", \"”\", \"R\", \"œ\", \"ç\", \"Ã\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"ú\", \"\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"̈\", \"🙂\", \"E\", \"↩\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"A\", \"¬\", \"😈\", \"K\", \"L\", \"é\", \"–\", \"k\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"l\", \"ü\", \"s\", \"😆\", \"\", \"‘\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"g\", \"J\", \"\", \"š\", \"B\", \"P\", \"`\", \"p\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"n\", \"Z\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/en": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1124813,
"_n_tokens": 372641,
"_n_chars": 1121360,
"_n_oov_chars": 32716,
"oov_ratio": 0.02917528715131626,
"_oov_charset": "[\"V\", \"U\", \"I\", \"—\", \"¡\", \"S\", \"¦\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"…\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"”\", \"é\", \"‑\", \"R\", \"–\", \"B\", \"P\", \"“\", \"Q\", \"😉\", \"X\", \"ï\", \"H\", \"\", \"😥\", \"F\", \"C\", \"‘\", \"ñ\", \"\", \"\", \"�\", \"Z\", \"´\", \"’\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/es": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1664455,
"_n_tokens": 683390,
"_n_chars": 1630297,
"_n_oov_chars": 71332,
"oov_ratio": 0.04375399083725235,
"_oov_charset": "[\"¿\", \"N\", \"G\", \"à\", \"M\", \"è\", \"D\", \"😀\", \"Í\", \"“\", \"😦\", \"ò\", \"X\", \"H\", \"ª\", \"Ñ\", \"\", \"👏\", \"’\", \"ó\", \"I\", \"¡\", \"ý\", \"á\", \"️\", \"…\", \"í\", \"”\", \"R\", \"▷\", \"😉\", \"\", \"ñ\", \"C\", \"F\", \"ú\", \"Ú\", \"🙂\", \"E\", \"✓\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"ö\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"–\", \"\", \"Q\", \"ü\", \"‘\", \"´\", \"ô\", \"O\", \"Ó\", \"М\", \"V\", \"Á\", \"\", \"J\", \"\", \"P\", \"B\", \"🙁\", \"1\", \"―\", \"Z\", \"4\", \"3\", \"v\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/fa": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2054052,
"_n_tokens": 386174,
"_n_chars": 1145876,
"_n_oov_chars": 354872,
"oov_ratio": 0.30969494081384025,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"N\", \"G\", \"9\", \"r\", \"ب\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"“\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"’\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"I\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"”\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"K\", \"L\", \"t\", \"–\", \"\", \"k\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"٫\", \"ـ\", \"O\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"Z\", \"4\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/fr": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1540504,
"_n_tokens": 616442,
"_n_chars": 1484970,
"_n_oov_chars": 74111,
"oov_ratio": 0.049907405536812194,
"_oov_charset": "[\"u\", \"N\", \"Â\", \"G\", \"à\", \"r\", \"è\", \"M\", \"À\", \"D\", \"x\", \"😀\", \"“\", \"ã\", \"Ê\", \"X\", \"û\", \"H\", \"Ô\", \"’\", \"Ç\", \"I\", \"h\", \"…\", \"í\", \"â\", \"ğ\", \"”\", \"R\", \"œ\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"♕\", \"\", \"F\", \"C\", \"b\", \"�\", \"̂\", \"🙂\", \"E\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"A\", \"K\", \"L\", \"́\", \"é\", \"–\", \"c\", \"Q\", \"ü\", \"🤔\", \"ê\", \"‘\", \"´\", \"ô\", \"O\", \"V\", \"Î\", \"ù\", \"̧\", \"J\", \"\", \"P\", \"B\", \"
\", \"ä\", \"È\", \"―\", \"Z\", \"v\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/ja": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1774770,
"_n_tokens": 483085,
"_n_chars": 603065,
"_n_oov_chars": 53217,
"oov_ratio": 0.08824421911402586,
"_oov_charset": "[\"ー\", \"蛍\", \"ペ\", \"G\", \"C\", \"め\", \"∀\", \"D\", \"ラ\", \"ベ\", \"ハ\", \"よ\", \"疎\", \"X\", \"妬\", \"I\", \"鉢\", \"欝\", \"K\", \"’\", \"ぅ\", \"R\", \"喩\", \"ク\", \"I\", \"筈\", \"讃\", \"…\", \"澪\", \"🌙\", \"暦\", \"G\", \"ズ\", \"F\", \"謳\", \"暁\", \"ロ\", \"犠\", \"ぉ\", \"゚\", \"ド\", \"—\", \"藁\", \"S\", \"轢\", \"穏\", \"و\", \"桟\", \"ヵ\", \"韮\", \"イ\", \"べ\", \"コ\", \"渓\", \"ど\", \"猟\", \"´\", \"ぽ\", \"鋲\", \"瘻\", \"O\", \"ゲ\", \"マ\", \"ご\", \"パ\", \"S\", \"゚\", \"ガ\", \"勲\", \"X\", \"`\", \"躾\", \"騒\", \"っ\", \"ダ\", \"―\", \"✧\", \"Z\", \"賛\", \"袴\", \"兎\", \"彡\", \"ㅂ\", \"を\", \"M\", \"ぞ\", \"酔\", \"M\", \"H\", \"辿\", \"く\", \"錬\", \"ジ\", \"粋\", \"レ\", \"が\", \"戯\", \"Z\", \"纒\", \"ゾ\", \"艸\", \"呟\", \"ぼ\", \"▷\", \"か\", \"殻\", \"ボ\", \"罠\", \"D\", \"\", \"え\", \"ゥ\", \"ビ\", \"逡\", \"ま\", \"謡\", \"娯\", \"�\", \"呑\", \"∇\", \"P\", \"ポ\", \"U\", \"遡\", \"挿\", \"ブ\", \"T\", \"⇔\", \"ギ\", \"L\", \"́\", \"缶\", \"–\", \"⻑\", \"\\b\", \"砕\", \"ぐ\", \"💦\", \"れ\", \"ヴ\", \"づ\", \"バ\", \"😢\", \"゙\", \"砦\", \"鋭\", \"●\", \"T\", \"艶\", \"梱\", \"俵\", \"ピ\", \"惣\", \"カ\", \"詈\", \"`\", \"捜\", \"も\", \"B\", \"P\", \"巣\", \"Д\", \"デ\", \"ろ\", \"ウ\", \"ば\", \"ぎ\", \"N\", \"醤\", \"お\", \"ら\", \"懐\", \"N\", \"饉\", \"L\", \"び\", \"陥\", \"Q\", \"ぴ\", \"奨\", \"し\", \"\", \"縦\", \"~\", \"繊\", \"ゞ\", \"髭\", \"じ\", \"カ\", \"顕\", \"醸\", \"匂\", \"😊\", \"メ\", \"V\", \"蝋\", \"⑪\", \"”\", \"▽\", \"こ\", \"◯\", \"コ\", \"プ\", \"讐\", \"ざ\", \"F\", \"C\", \"壌\", \"O\", \"E\", \"Ⅹ\", \"贔\", \"鶏\", \"ぷ\", \"̈\", \"E\", \"す\", \"H\", \"噛\", \"峠\", \"Y\", \"ぜ\", \"鞄\", \"捗\", \"K\", \"‼\", \"㎞\", \"Q\", \"舘\", \"J\", \"縞\", \"\", \"だ\", \"拠\", \"̀\", \"麹\", \"飴\", \"グ\", \"V\", \"ィ\", \"拝\", \"贋\", \"噂\", \"屓\", \"リ\", \"〟\", \"ん\", \"覗\", \"剰\", \"渕\", \"ザ\", \"ヘ\", \"繰\", \"あ\", \"げ\", \"ア\", \"W\", \"繍\", \"〆\", \"フ\", \"“\", \"゙\", \"た\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"そ\", \"り\", \"漑\", \"ゴ\", \"汚\", \"渇\", \"ゎ\", \"R\", \"︎\", \"リ\", \"斉\", \"う\", \"‐\", \"\\u001b\", \"﨑\", \"😌\", \"廻\", \"鉱\", \"黙\", \"簗\", \"拶\", \"ゼ\", \"U\", \"W\", \"ヨ\", \"痩\", \"摂\", \"A\", \"Y\", \"ぱ\", \"頬\", \"ず\", \"な\", \"A\", \"揺\", \"掻\", \" \", \"ぶ\", \"B\", \"囁\", \"枠\", \"ヾ\", \"メ\", \"釈\", \"ミ\", \"ね\", \"J\", \"レ\", \"曽\", \"6\", \"で\", \"訃\", \"テ\", \"1\", \"◡\", \"ー\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/ko": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 1524839,
"_n_tokens": 1035974,
"_n_chars": 655190,
"_n_oov_chars": 441262,
"oov_ratio": 0.6734870800836399,
"_oov_charset": "[\"잖\", \"췌\", \"은\", \"G\", \"빈\", \"갈\", \"싱\", \"체\", \"D\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"👏\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"짠\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"승\", \"ㅕ\", \"커\", \"먹\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"쫒\", \"◈\", \"촉\", \"욥\", \"텀\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"뢰\", \"♡\", \"너\", \"😂\", \"별\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"퍙\", \"루\", \"붐\", \"女\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"툼\", \"F\", \"컸\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"➊\", \"훅\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"낮\", \"왓\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"⬇\", \"멕\", \"↕\", \"않\", \"츈\", \"텁\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"l\", \"왼\", \"㉿\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"♤\", \"←\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"ㅙ\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"맬\", \"🦅\", \"쪄\", \"션\", \"히\", \"벚\", \"’\", \"즙\", \"뺀\", \"쳤\", \"a\", \"준\", \"I\", \"얏\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"S\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"케\", \"멜\", \"🤗\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"코\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"돗\", \"곡\", \"핍\", \"옆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"급\", \"누\", \"밟\", \"셰\", \"맷\", \"💥\", \"N\", \"렷\", \"렘\", \"령\", \"트\", \"悧\", \"💰\", \"윗\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"즈\", \"킥\", \"C\", \"문\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"8\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"압\", \"언\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"볍\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"훨\", \"걸\", \"돠\", \"🌵\", \"서\", \"숭\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"흄\", \"릅\", \"💣\", \"촬\", \"층\", \"묶\", \"🏻\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"냉\", \"힙\", \"팽\", \"헝\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"3\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"넌\", \"임\", \"ㅔ\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"몸\", \"쥬\", \"—\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"톨\", \"냈\", \"푸\", \"배\", \"앤\", \"재\", \"책\", \"‘\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"챗\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"H\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"듈\", \"뜸\", \"탐\", \"미\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"🙌\", \"B\", \"P\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"환\", \"렐\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"퉁\", \"웃\", \"그\", \"렴\", \"생\", \"대\", \"융\", \"묵\", \"”\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"족\", \"닥\", \"힜\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"Q\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"겐\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"6\", \"납\", \" \", \"므\", \"릉\", \"텅\", \"우\", \"켐\", \"펠\", \"“\", \"랐\", \"습\", \"강\", \"뛸\", \"색\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"조\", \"틔\", \"넹\", \"끙\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"숫\", \"죤\", \"툭\", \"흠\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"璣\", \"륙\", \"굉\", \"ᴀ\", \"놔\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"👨\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"섞\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"웬\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"짊\", \"㏊\", \"젊\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"쟁\", \"폐\", \"괌\", \"넓\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"징\", \"5\", \"L\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"不\", \"🙇\", \"게\", \"탬\", \"숨\", \"축\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"류\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"았\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"삼\", \"착\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"Ⅸ\", \"k\", \"웹\", \"뤘\", \"龍\", \"팍\", \"곁\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"컴\", \"파\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"飮\", \"마\", \"탁\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"ckiplab/gpt2-base-chinese @ cc100/zh-Hans": {
"tokenizer": "gpt2-base-chinese",
"organization": "SINICA",
"vocab_size": 21128,
"_n_bytes": 2633047,
"_n_tokens": 879506,
"_n_chars": 927311,
"_n_oov_chars": 34029,
"oov_ratio": 0.0366964265494532,
"_oov_charset": "[\"翕\", \"擤\", \"镏\", \"猡\", \"ㄓ\", \"\", \" \", \"N\", \"G\", \"à\", \"⒀\", \"C\", \"M\", \"D\", \"鼯\", \"浠\", \"屣\", \"Ø\", \"牖\", \"“\", \"戢\", \"浞\", \"X\", \"倨\", \"H\", \"馕\", \"\", \"’\", \"韫\", \"ě\", \"疴\", \"锒\", \"I\", \"鄯\", \"旆\", \"á\", \"ὐ\", \"V\", \"…\", \"穰\", \"韪\", \"”\", \"R\", \"ç\", \"⒁\", \"î\", \"犟\", \"ズ\", \"D\", \"\", \"\", \"龇\", \"F\", \"C\", \"瑑\", \"�\", \"狳\", \"\", \"E\", \"U\", \"\\u0000\", \"—\", \"S\", \"诨\", \"W\", \"T\", \"犰\", \"耩\", \"⒂\", \"Y\", \"阽\", \"鲎\", \"A\", \"啐\", \"K\", \"L\", \"é\", \"\\u0005\", \"溘\", \"–\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"ό\", \"Q\", \"\\u0006\", \" \", \"\", \"‘\", \"ê\", \"逑\", \"\", \"O\", \"T\", \"鸩\", \"V\", \"黢\", \"旳\", \"⒌\", \"瑒\", \"炝\", \"⒃\", \"ù\", \"瑢\", \"J\", \"黧\", \"P\", \"B\", \"瑧\", \"黩\", \"`\", \"岣\", \"绉\", \"篢\", \"\\u0007\", \"―\", \"瑨\", \"Z\", \"N\", \"讦\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ar": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2813283,
"_n_tokens": 601762,
"_n_chars": 1560987,
"_n_oov_chars": 374080,
"oov_ratio": 0.2396432513531503,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"G\", \"9\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"×\", \"ۤ\", \"د\", \"۰\", \"d\", \"٨\", \"X\", \"▫\", \"i\", \"®\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"’\", \"a\", \"ٌ\", \"😊\", \"ج\", \"I\", \"h\", \"¡\", \"m\", \"\", \"♥\", \"ن\", \"…\", \"7\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"”\", \"ئ\", \"٪\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"—\", \"v\", \"S\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"o\", \"–\", \"\", \"k\", \"Х\", \"﴿\", \"؛\", \"Q\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"V\", \"٧\", \"۷\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"B\", \"P\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"ä\", \"ص\", \"ّ\", \"ث\", \"n\", \"4\", \"Z\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/de": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1814876,
"_n_tokens": 895612,
"_n_chars": 1784021,
"_n_oov_chars": 112257,
"oov_ratio": 0.0629235866618162,
"_oov_charset": "[\"©\", \"u\", \"¶\", \"İ\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"à\", \"9\", \"☺\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"x\", \"Ø\", \"😀\", \"‚\", \"😦\", \"y\", \"X\", \"û\", \"H\", \"°\", \"å\", \"’\", \"ó\", \"I\", \"h\", \"\", \"č\", \"á\", \"…\", \"♥\", \"7\", \"â\", \"”\", \"R\", \"œ\", \"ç\", \"Ã\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"™\", \"ú\", \"\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"̈\", \"🙂\", \"E\", \"😂\", \"↩\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"8\", \"A\", \"¬\", \"😈\", \"K\", \"L\", \"é\", \"–\", \"k\", \"❤\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"l\", \"ü\", \"s\", \"😆\", \"\", \"2\", \"3\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"0\", \"²\", \"g\", \"J\", \"\", \"š\", \"B\", \"P\", \"`\", \"p\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"1\", \"ä\", \"n\", \"Z\", \"4\", \"6\", \"♦\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/en": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1124813,
"_n_tokens": 563058,
"_n_chars": 1121360,
"_n_oov_chars": 32541,
"oov_ratio": 0.029019226653349505,
"_oov_charset": "[\"V\", \"U\", \"I\", \"—\", \"¡\", \"S\", \"¦\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"…\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"”\", \"é\", \"‑\", \"R\", \"–\", \"B\", \"P\", \"Q\", \"😉\", \"X\", \"ï\", \"®\", \"H\", \"\", \"😥\", \"F\", \"C\", \"ñ\", \"\", \"\", \"�\", \"Z\", \"´\", \"’\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/es": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1664455,
"_n_tokens": 846564,
"_n_chars": 1630297,
"_n_oov_chars": 70692,
"oov_ratio": 0.043361424329432,
"_oov_charset": "[\"©\", \"¿\", \"N\", \"G\", \"à\", \"M\", \"è\", \"D\", \"😀\", \"Í\", \"😦\", \"ò\", \"X\", \"®\", \"H\", \"ª\", \"°\", \"Ñ\", \"\", \"👏\", \"’\", \"ó\", \"I\", \"¡\", \"ý\", \"á\", \"️\", \"…\", \"í\", \"”\", \"R\", \"▷\", \"😉\", \"\", \"ñ\", \"C\", \"F\", \"ú\", \"✔\", \"Ú\", \"🙂\", \"✖\", \"E\", \"✓\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"ö\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"–\", \"❤\", \"\", \"Q\", \"ü\", \"👍\", \"2\", \"´\", \"ô\", \"O\", \"Ó\", \"М\", \"V\", \"Á\", \"\", \"0\", \"²\", \"J\", \"\", \"P\", \"B\", \"🙁\", \"1\", \"―\", \"Z\", \"4\", \"6\", \"3\", \"v\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/fa": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2054052,
"_n_tokens": 387763,
"_n_chars": 1145876,
"_n_oov_chars": 354860,
"oov_ratio": 0.30968446847651926,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"N\", \"G\", \"9\", \"r\", \"ب\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"’\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"I\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"”\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"K\", \"L\", \"t\", \"–\", \"\", \"k\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"ـ\", \"O\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"Z\", \"4\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/fr": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1540504,
"_n_tokens": 767363,
"_n_chars": 1484970,
"_n_oov_chars": 74418,
"oov_ratio": 0.05011414372007515,
"_oov_charset": "[\"u\", \"♠\", \"N\", \"Â\", \"G\", \"à\", \"9\", \"r\", \"è\", \"M\", \"À\", \"D\", \"x\", \"😀\", \"ã\", \"Ê\", \"X\", \"û\", \"®\", \"H\", \"°\", \"Ô\", \"’\", \"Ç\", \"I\", \"h\", \"…\", \"í\", \"7\", \"â\", \"ğ\", \"”\", \"R\", \"œ\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"♕\", \"\", \"F\", \"C\", \"™\", \"b\", \"�\", \"̂\", \"🙂\", \"E\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"8\", \"5\", \"A\", \"K\", \"L\", \"́\", \"é\", \"–\", \"k\", \"❤\", \"c\", \"Q\", \"ü\", \"🤔\", \"ê\", \"2\", \"´\", \"ô\", \"O\", \"V\", \"0\", \"Î\", \"²\", \"ù\", \"̧\", \"J\", \"\", \"P\", \"B\", \"1\", \"
\", \"ä\", \"È\", \"―\", \"4\", \"6\", \"Z\", \"3\", \"v\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ja": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1774770,
"_n_tokens": 319411,
"_n_chars": 603065,
"_n_oov_chars": 420060,
"oov_ratio": 0.696541832140814,
"_oov_charset": "[\"a\", \"ー\", \"濫\", \"③\", \"蛍\", \"ペ\", \"嶽\", \"サ\", \"綜\", \"監\", \"9\", \"G\", \"セ\", \"慄\", \"f\", \"C\", \"e\", \"門\", \"釘\", \"め\", \"ァ\", \"資\", \"録\", \"針\", \"紐\", \"ラ\", \"D\", \"ベ\", \"諸\", \"ぃ\", \"x\", \"嘗\", \"載\", \"細\", \"よ\", \"須\", \"塗\", \"ハ\", \"飽\", \"膚\", \"に\", \"疎\", \"綾\", \"絡\", \"ヲ\", \"X\", \"僕\", \"妬\", \"I\", \"穫\", \"エ\", \"著\", \"鉢\", \"欝\", \"噴\", \"聖\", \"絞\", \"損\", \"騰\", \"⑩\", \"K\", \"貿\", \"貰\", \"蓮\", \"競\", \"別\", \"’\", \"誠\", \"ぅ\", \"t\", \"a\", \"嘆\", \"R\", \"喩\", \"馬\", \"ク\", \"ィ\", \"導\", \"腎\", \"I\", \"嗚\", \"態\", \"・\", \"m\", \"筈\", \"勝\", \"オ\", \"撫\", \"罰\", \"讃\", \"糞\", \"て\", \"傾\", \"…\", \"−\", \"¥\", \"澪\", \"夢\", \"🌙\", \"衝\", \"誘\", \"ょ\", \"話\", \"d\", \"縮\", \"遺\", \"協\", \"婦\", \"暦\", \"G\", \"ズ\", \"F\", \"緩\", \">\", \"認\", \"箋\", \"謳\", \"暁\", \"✨\", \"ロ\", \"靄\", \"債\", \"②\", \"師\", \"優\", \"犠\", \"時\", \"ぉ\", \"糾\", \"獲\", \"雲\", \"動\", \"呂\", \"財\", \"f\", \"ド\", \"為\", \"燭\", \"—\", \"銃\", \"項\", \"゚\", \"藁\", \"閣\", \"鎮\", \"S\", \"轢\", \"暢\", \"穢\", \"視\", \"紙\", \"穏\", \"離\", \"揚\", \"薦\", \"選\", \"論\", \"و\", \"擁\", \"鍋\", \"桟\", \"揮\", \"暫\", \"鳴\", \"ヵ\", \"輩\", \"偉\", \"韮\", \"イ\", \"結\", \"陳\", \"詠\", \"決\", \"淵\", \"べ\", \"ゝ\", \"ヘ\", \"館\", \"コ\", \"謗\", \"渓\", \"ど\", \"誌\", \"診\", \"紅\", \"猟\", \"阪\", \"帳\", \"臨\", \"蘇\", \"瘍\", \"岡\", \"´\", \"ぽ\", \"緑\", \"鋲\", \"O\", \"瘻\", \"ゲ\", \"測\", \"礎\", \"槍\", \"る\", \"違\", \"頻\", \"ニ\", \"0\", \"嵐\", \"儀\", \"キ\", \"貨\", \"マ\", \"ご\", \"ュ\", \"躊\", \"の\", \"慣\", \"パ\", \"審\", \"級\", \"侶\", \"g\", \"S\", \"゚\", \"ガ\", \"礫\", \"勲\", \"億\", \"ぬ\", \"b\", \"訝\", \"臥\", \"X\", \"`\", \"計\", \"綴\", \"喪\", \"陣\", \"紹\", \"週\", \"佇\", \"轄\", \"隊\", \"敗\", \"輪\", \"躾\", \"騒\", \"賃\", \"っ\", \"棟\", \"貪\", \"ダ\", \"―\", \"♪\", \"務\", \"許\", \"n\", \"✧\", \"4\", \"Z\", \"賛\", \"預\", \"顔\", \"④\", \"網\", \"間\", \"鶴\", \"∀\", \"賭\", \"袴\", \"車\", \"鮮\", \"兎\", \"タ\", \"9\", \"彡\", \"鴻\", \"葉\", \"閉\", \"爾\", \"ㅂ\", \"を\", \"鳥\", \"M\", \"ナ\", \"還\", \"涼\", \"蒔\", \"ぞ\", \"ム\", \"規\", \"酔\", \"姦\", \"於\", \"軒\", \"M\", \"織\", \"訊\", \"y\", \"墳\", \"倫\", \"陽\", \"貫\", \"貧\", \"余\", \"H\", \"養\", \"談\", \"難\", \"辿\", \"く\", \"錠\", \"ゃ\", \"員\", \"錬\", \"貼\", \"孫\", \"並\", \"ジ\", \"粋\", \"鬱\", \"準\", \"緻\", \"レ\", \"ケ\", \"風\", \"課\", \"が\", \"懇\", \"餌\", \"悶\", \"戯\", \"遊\", \"墜\", \"▼\", \"4\", \"→\", \"衆\", \"諺\", \"Z\", \"7\", \"纒\", \"達\", \"ゾ\", \"誹\", \"冊\", \"艸\", \"℃\", \"は\", \"呟\", \"絆\", \"幾\", \"個\", \"ぼ\", \"か\", \"▷\", \"殻\", \"ボ\", \"罠\", \"緒\", \"庫\", \"D\", \"\", \"え\", \"漬\", \"ゥ\", \"ビ\", \"7\", \"劉\", \"逡\", \"ま\", \"謡\", \"娯\", \"h\", \"�\", \"◇\", \"呑\", \"∇\", \"P\", \"=\", \"開\", \"篤\", \"み\", \"題\", \"♡\", \"聾\", \"ポ\", \"撲\", \"訓\", \"賊\", \"△\", \"U\", \"銘\", \"誤\", \"遡\", \"挿\", \"訟\", \"飼\", \"運\", \"場\", \"ブ\", \"閃\", \"T\", \"○\", \"諾\", \"⇔\", \"隕\", \"嘩\", \"詰\", \"鏡\", \"識\", \"5\", \"奪\", \"ギ\", \"編\", \"L\", \"́\", \"誰\", \"ン\", \"覆\", \"o\", \"缶\", \"馳\", \"–\", \"鉛\", \"顎\", \"強\", \"⻑\", \"\\b\", \"き\", \"ぐ\", \"砕\", \"💦\", \"闊\", \"潰\", \"れ\", \"馴\", \"モ\", \"ヴ\", \"麗\", \"訂\", \"づ\", \"濃\", \"ス\", \"樹\", \"請\", \"テ\", \"ヤ\", \"詫\", \"誕\", \"ゥ\", \"バ\", \"😢\", \"゙\", \"腫\", \"砦\", \"鋭\", \"●\", \"賢\", \"T\", \"績\", \"綺\", \"乾\", \"艶\", \"ハ\", \"梱\", \"係\", \"¥\", \"w\", \"電\", \"慶\", \"飲\", \"採\", \"趨\", \"俵\", \"ピ\", \"訪\", \"惣\", \"衛\", \"カ\", \"詈\", \"ひ\", \"駒\", \"併\", \"滅\", \"棄\", \"斂\", \"`\", \"捜\", \"順\", \"灘\", \"虜\", \"も\", \"ソ\", \"調\", \"ぇ\", \"♫\", \"B\", \"P\", \"^\", \"恥\", \"闖\", \"謀\", \"巣\", \"Д\", \"憂\", \"橋\", \"問\", \"デ\", \"懸\", \"1\", \"ノ\", \"僅\", \"ぁ\", \"贅\", \"ト\", \"ノ\", \"ろ\", \"ウ\", \"ぎ\", \"ば\", \"N\", \"v\", \"y\", \"艦\", \"纏\", \"©\", \"療\", \"給\", \"醤\", \"紋\", \"お\", \"ら\", \"5\", \"譜\", \"n\", \"憲\", \"懐\", \"農\", \"N\", \"貴\", \"約\", \"饉\", \"L\", \"絶\", \"積\", \"び\", \"鵜\", \"貸\", \"産\", \"譚\", \"討\", \"軸\", \"陥\", \"Q\", \"×\", \"緯\", \"嚥\", \"ぴ\", \"渦\", \"備\", \"東\", \"し\", \"質\", \"製\", \"奨\", \"\", \"~\", \"謂\", \"縦\", \"腸\", \"紗\", \"側\", \"ゞ\", \"繊\", \"飾\", \"け\", \"慮\", \"頂\", \"駕\", \"宮\", \"髭\", \"じ\", \"郵\", \"災\", \"鎖\", \"カ\", \"欄\", \"該\", \"顕\", \"■\", \"と\", \"g\", \"<\", \"誇\", \"匂\", \"😊\", \"醸\", \"劇\", \"長\", \"⇒\", \"曇\", \"鐘\", \"應\", \"メ\", \"V\", \"ヌ\", \"龍\", \"蝋\", \"塚\", \"ゆ\", \"彙\", \"⑪\", \"職\", \"”\", \"墾\", \"輸\", \"o\", \"ワ\", \"欽\", \"醜\", \"↓\", \"こ\", \"▽\", \"憶\", \"コ\", \"曖\", \"鈴\", \"◯\", \"贈\", \"憤\", \"プ\", \"讐\", \"〇\", \"ざ\", \"鱈\", \"F\", \"潔\", \"C\", \"壌\", \"O\", \"盤\", \"E\", \"術\", \"純\", \"頷\", \"Ⅹ\", \"島\", \"贔\", \"遠\", \"謙\", \"鶏\", \"ョ\", \"ぷ\", \"標\", \"終\", \"̈\", \"漢\", \"統\", \"E\", \"躍\", \"償\", \"3\", \"ッ\", \"倉\", \"親\", \"す\", \"則\", \"H\", \"噛\", \"綱\", \"塊\", \"峠\", \"ャ\", \"縫\", \"喚\", \"Y\", \"異\", \"ぜ\", \"8\", \"締\", \"鞄\", \"e\", \"捗\", \"z\", \"K\", \"簡\", \"幣\", \"領\", \"見\", \"負\", \"銀\", \"記\", \"‼\", \"ゅ\", \"ツ\", \"㎞\", \"頑\", \"構\", \"Q\", \"舘\", \"報\", \"複\", \"況\", \"J\", \"膿\", \"s\", \"ヽ\", \"潤\", \"縞\", \"\", \"だ\", \"機\", \"擬\", \"堅\", \"拠\", \"2\", \"̀\", \"ヒ\", \"傘\", \"書\", \"麹\", \"詮\", \"餃\", \"飴\", \"脈\", \"グ\", \"l\", \"V\", \"シ\", \"諦\", \"拝\", \"ィ\", \"贋\", \"猶\", \"額\", \"噂\", \"屓\", \"リ\", \"〟\", \"わ\", \"試\", \"創\", \" ̄\", \"貢\", \"熱\", \"貶\", \"ん\", \"鍛\", \"p\", \"唄\", \"過\", \"責\", \"組\", \"覗\", \"剰\", \"ォ\", \"渕\", \"飛\", \"費\", \"チ\", \"議\", \"ユ\", \"韓\", \"s\", \"ザ\", \"↑\", \"ヘ\", \"6\", \"無\", \"願\", \"蓋\", \"較\", \"繰\", \"詐\", \"罵\", \"u\", \"餓\", \"錯\", \"あ\", \"敵\", \"後\", \"連\", \"頃\", \"遜\", \"飢\", \"げ\", \"つ\", \"ア\", \"W\", \"r\", \"確\", \"漁\", \"種\", \"啓\", \"範\", \"─\", \"繍\", \"〆\", \"窪\", \"層\", \"貯\", \"q\", \"脅\", \"懲\", \"フ\", \"捨\", \"釣\", \"゙\", \"た\", \"摯\", \"紀\", \"d\", \"勢\", \"賠\", \"軋\", \"i\", \"む\", \"掛\", \"®\", \"儲\", \"湯\", \"飯\", \"駿\", \"訴\", \"謎\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"餅\", \"納\", \"ア\", \"節\", \"ネ\", \"輿\", \"り\", \"そ\", \"駐\", \"築\", \"線\", \"楊\", \"國\", \"h\", \"漑\", \"貝\", \"ル\", \"謝\", \"詳\", \"ゴ\", \"磯\", \"輝\", \"彌\", \"汚\", \"環\", \"賀\", \"渇\", \"華\", \"頓\", \"フ\", \"ゎ\", \"へ\", \"R\", \"適\", \"ほ\", \"掃\", \"ヶ\", \"跡\", \"ち\", \"極\", \"設\", \"騙\", \"︎\", \"綻\", \"リ\", \"閲\", \"斉\", \"煙\", \"う\", \"澤\", \"々\", \"紡\", \"絨\", \"‐\", \"聞\", \"﨑\", \"m\", \"j\", \"\\u001b\", \"沖\", \"換\", \"襲\", \"語\", \"階\", \"謬\", \"奮\", \"😌\", \"廻\", \"響\", \"鉱\", \"b\", \"獄\", \"窮\", \"偽\", \"黙\", \"紛\", \"綬\", \"★\", \"穀\", \"ホ\", \"縛\", \"評\", \"講\", \"軟\", \"簗\", \"せ\", \"ウ\", \"拶\", \"瞭\", \"ゼ\", \"r\", \"裏\", \"託\", \"顧\", \"塵\", \"殺\", \"U\", \"鈍\", \"驚\", \"W\", \"軌\", \"業\", \"+\", \"陸\", \"ヨ\", \"頒\", \"緊\", \"殲\", \"憑\", \"痩\", \"軍\", \"摂\", \"A\", \"8\", \"Y\", \"幹\", \"ぱ\", \"頬\", \"ず\", \"t\", \"な\", \"尋\", \"賞\", \"k\", \"A\", \"❤\", \"揺\", \"c\", \"l\", \"掻\", \"2\", \"凱\", \" \", \"徹\", \"斬\", \"疇\", \"貞\", \"厭\", \"い\", \"ぶ\", \"購\", \"鍵\", \"B\", \"囁\", \"這\", \"籠\", \"☆\", \"習\", \"練\", \"魚\", \"詞\", \"ふ\", \"$\", \"枠\", \"壇\", \"樺\", \"霧\", \"傑\", \"◎\", \"閑\", \"ヾ\", \"張\", \"諏\", \"←\", \"頭\", \"詩\", \"輔\", \"訣\", \"煩\", \"メ\", \"0\", \"傷\", \"や\", \"⑧\", \"愛\", \"賑\", \"園\", \"滲\", \"遙\", \"義\", \"護\", \"偵\", \"釈\", \"進\", \"ミ\", \"ね\", \"ロ\", \"際\", \"興\", \"牽\", \"棲\", \"J\", \"凍\", \"鯖\", \"復\", \"説\", \"β\", \"レ\", \"補\", \"i\", \"曽\", \"買\", \"寧\", \"筆\", \"執\", \"6\", \"薩\", \"楓\", \"w\", \"で\", \"販\", \"ェ\", \"訃\", \"テ\", \"さ\", \"類\", \"維\", \"現\", \"1\", \"ヨ\", \"陰\", \"遼\", \"羅\", \"減\", \"糧\", \"謄\", \"◡\", \"k\", \"ー\", \"3\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/ko": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 1524839,
"_n_tokens": 206812,
"_n_chars": 655190,
"_n_oov_chars": 492835,
"oov_ratio": 0.7522016514293564,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"갈\", \"싱\", \"체\", \"D\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"짠\", \"獻\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"뢰\", \"題\", \"너\", \"♡\", \"😂\", \"별\", \"△\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"專\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"붐\", \"女\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"學\", \"툼\", \"F\", \"컸\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"聖\", \"션\", \"히\", \"벚\", \"歲\", \"’\", \"즙\", \"뺀\", \"쳤\", \"a\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"S\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"©\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"C\", \"문\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"8\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"韓\", \"s\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"國\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"돠\", \"🌵\", \"j\", \"서\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"왘\", \"樺\", \"흄\", \"릅\", \"💣\", \"촬\", \"층\", \"묶\", \"🏻\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"놨\", \"x\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"f\", \"—\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"푸\", \"結\", \"陳\", \"배\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"峴\", \"챗\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"課\", \"듈\", \"뜸\", \"탐\", \"미\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"×\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"”\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"Q\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"6\", \"납\", \"後\", \" \", \"므\", \"릉\", \"發\", \"텅\", \"우\", \"켐\", \"펠\", \"랐\", \"습\", \"i\", \"®\", \"강\", \"뛸\", \"색\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"韜\", \"華\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"驚\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"燦\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"L\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"し\", \"류\", \"說\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"す\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"쉬\", \"謝\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"t\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"龍\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"內\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"clue/roberta_chinese_clue_tiny @ cc100/zh-Hans": {
"tokenizer": "roberta-chinese-clue",
"organization": "CLUE",
"vocab_size": 8021,
"_n_bytes": 2633047,
"_n_tokens": 887144,
"_n_chars": 927311,
"_n_oov_chars": 31452,
"oov_ratio": 0.03391742360437868,
"_oov_charset": "[\"a\", \"©\", \"翕\", \"網\", \"擤\", \"镏\", \"猡\", \"後\", \"據\", \"ㄓ\", \"\", \"n\", \" \", \"發\", \"N\", \"G\", \"9\", \"à\", \"⒀\", \"號\", \"確\", \"C\", \"門\", \"M\", \"資\", \"D\", \"鼯\", \"浠\", \"屣\", \"Ø\", \"牖\", \"於\", \"×\", \"戢\", \"當\", \"浞\", \"~\", \"X\", \"倨\", \"余\", \"H\", \"著\", \"慮\", \"噴\", \"°\", \"損\", \"馕\", \"\", \"員\", \"’\", \"別\", \"韫\", \"p\", \"ě\", \"t\", \"疴\", \"並\", \"锒\", \"I\", \"鄯\", \"・\", \"メ\", \"旆\", \"á\", \"ὐ\", \"V\", \"…\", \"壓\", \"7\", \"穰\", \"彙\", \"韪\", \"℃\", \"”\", \"へ\", \"R\", \"個\", \"o\", \"d\", \"ç\", \"⒁\", \"î\", \"犟\", \"ズ\", \"D\", \"\", \"\", \"龇\", \"F\", \"C\", \"卻\", \"瑑\", \"�\", \"h\", \"狳\", \"★\", \"標\", \"\", \"時\", \"劑\", \"E\", \"r\", \"動\", \"U\", \"為\", \"\\u0000\", \"—\", \"託\", \"S\", \"運\", \"诨\", \"W\", \"T\", \"權\", \"犰\", \"+\", \"耩\", \"⒂\", \"Y\", \"選\", \"阽\", \"8\", \"亂\", \"5\", \"e\", \"鲎\", \"A\", \"啐\", \"K\", \"L\", \"é\", \"覆\", \"\\u0005\", \"溘\", \"–\", \"イ\", \"瑥\", \"A\", \"強\", \"\\b\", \"\", \"⑿\", \"漲\", \"ό\", \"Q\", \"\\u0006\", \"報\", \"2\", \" \", \"\", \"阪\", \"ê\", \"2\", \"逑\", \"\", \"O\", \"▪\", \"T\", \"麽\", \"鸩\", \"乾\", \"V\", \"0\", \"シ\", \"黢\", \"旳\", \"電\", \"0\", \"採\", \"の\", \"⒌\", \"瑒\", \"炝\", \"撐\", \"娛\", \"⒃\", \"ù\", \"瑢\", \"J\", \"藉\", \"黧\", \"併\", \"i\", \"ソ\", \"價\", \"P\", \"B\", \"瑧\", \"黩\", \"`\", \"內\", \"賣\", \"岣\", \"薩\", \"绉\", \"篢\", \"1\", \"ノ\", \"ヨ\", \"1\", \"\\u0007\", \"―\", \"s\", \"灑\", \"ト\", \"瑨\", \"Z\", \"6\", \"4\", \"3\", \"N\", \"讦\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/ar": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2813283,
"_n_tokens": 2066944,
"_n_chars": 1560987,
"_n_oov_chars": 202,
"oov_ratio": 0.00012940530574565964,
"_oov_charset": "[\"…\", \"″\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"ﻷ\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/de": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1814876,
"_n_tokens": 845425,
"_n_chars": 1784021,
"_n_oov_chars": 484,
"oov_ratio": 0.0002712972549089949,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"¹\", \"™\", \"½\", \"´\", \" \", \"̈\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/en": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1124813,
"_n_tokens": 391092,
"_n_chars": 1121360,
"_n_oov_chars": 59,
"oov_ratio": 5.261468217164871e-05,
"_oov_charset": "[\"⑤\", \"…\", \"⑩\", \"⑦\", \"③\", \"´\", \"‑\", \"⑧\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/es": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1664455,
"_n_tokens": 759244,
"_n_chars": 1630297,
"_n_oov_chars": 528,
"oov_ratio": 0.0003238673689517922,
"_oov_charset": "[\"…\", \"″\", \"²\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/fa": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2054052,
"_n_tokens": 1588140,
"_n_chars": 1145876,
"_n_oov_chars": 606,
"oov_ratio": 0.0005288530347088167,
"_oov_charset": "[\" \", \"…\", \"ﮧ\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/fr": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1540504,
"_n_tokens": 686144,
"_n_chars": 1484970,
"_n_oov_chars": 864,
"oov_ratio": 0.0005818299359583021,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/ja": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1774770,
"_n_tokens": 253868,
"_n_chars": 603065,
"_n_oov_chars": 7382,
"oov_ratio": 0.012240803230165902,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"つ\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"た\", \"④\", \"し\", \"~\", \"I\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"と\", \"g\", \"<\", \"-\", \"V\", \"4\", \"て\", \"Z\", \"…\", \"¥\", \"⑪\", \"℃\", \"は\", \"フ\", \"へ\", \"①\", \"o\", \"か\", \"d\", \"G\", \"D\", \"コ\", \"F\", \"ゥ\", \">\", \"7\", \"m\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ホ\", \"ウ\", \"r\", \"せ\", \"3\", \"゚\", \"す\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"A\", \"‼\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"ス\", \"B\", \"ヒ\", \"ふ\", \"$\", \"゙\", \"´\", \"T\", \"l\", \":\", \"0\", \"シ\", \"ィ\", \"%\", \"ハ\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"゚\", \"ひ\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ト\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/ko": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 1524839,
"_n_tokens": 1379975,
"_n_chars": 655190,
"_n_oov_chars": 1311,
"oov_ratio": 0.0020009462903890474,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"*\", \"ㄷ\", \"@\", \"ㅜ\", \"?\", \"ㅐ\", \"Ⅷ\", \"ㅛ\", \"․\", \"ㅝ\", \"Ⅱ\", \"ㄹ\", \"Ⅶ\", \"㏊\", \"Ⅵ\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"②\", \"⑸\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"ㅢ\", \"ㅈ\", \"ㅋ\", \"㎡\", \"ㅑ\", \"梁\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"‥\", \" \", \"樂\", \"流\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"ㅆ\", \"ㅘ\", \":\", \"⑹\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"⑦\", \"ⅱ\", \"ⅰ\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"ㅎ\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"④\"]",
"reversible": false
},
"cyberagent/open-calm-7b @ cc100/zh-Hans": {
"tokenizer": "open-calm-7b",
"organization": "CyberAgent",
"vocab_size": 52000,
"_n_bytes": 2633047,
"_n_tokens": 1073991,
"_n_chars": 927311,
"_n_oov_chars": 49193,
"oov_ratio": 0.05304908493482769,
"_oov_charset": "[\"a\", \"r\", \"0\", \"3\", \"%\", \"\\u0000\", \" \", \"]\", \"③\", \"⑶\", \"/\", \"⑥\", \"5\", \"-\", \"n\", \" \", \"⒌\", \"⑴\", \"⑧\", \"9\", \"V\", \"+\", \"⒂\", \"4\", \"⒀\", \"C\", \"…\", \"⒃\", \"e\", \"⑦\", \"8\", \"⑨\", \"[\", \"℃\", \"①\", \"o\", \"&\", \"i\", \"d\", \"A\", \"⒋\", \"!\", \"⑿\", \".\", \"⑷\", \"⒁\", \")\", \"④\", \"6\", \"D\", \"_\", \"2\", \""\", \";\", \"~\", \" \", \"N\", \"7\", \",\", \"⑤\", \"1\", \"⑩\", \"(\", \"h\", \"s\", \"・\", \"②\", \"⑸\", \"p\", \"T\", \"t\", \":\", \"?\"]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/ar": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/de": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/en": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1124813,
"_n_tokens": 254985,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/es": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/fa": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/fr": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/ja": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/ko": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"databricks/dbrx-instruct @ cc100/zh-Hans": {
"tokenizer": "dbrx-instruct",
"organization": "Databricks",
"vocab_size": 100280,
"_n_bytes": 2633047,
"_n_tokens": 1084939,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/ar": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2813283,
"_n_tokens": 309525,
"_n_chars": 1560987,
"_n_oov_chars": 1354421,
"oov_ratio": 0.867669621848228,
"_oov_charset": "[\"م\", \"u\", \" \", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"9\", \"G\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"×\", \"ۤ\", \"د\", \"۰\", \"d\", \"y\", \"٨\", \"X\", \"τ\", \"▫\", \"i\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"a\", \"ٌ\", \"😊\", \"ج\", \"I\", \"█\", \"h\", \"‹\", \"m\", \"\", \"♥\", \"ن\", \"…\", \"7\", \"χ\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"b\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"μ\", \"U\", \"v\", \"S\", \"α\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"k\", \"\", \"Х\", \"﴿\", \"›\", \"c\", \"؛\", \"Q\", \"٠\", \"l\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"V\", \"٧\", \"۷\", \"←\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"B\", \"P\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"″\", \"ä\", \"ص\", \"ّ\", \"ث\", \"n\", \"η\", \"4\", \"6\", \"Z\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/de": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1814876,
"_n_tokens": 382494,
"_n_chars": 1784021,
"_n_oov_chars": 111524,
"oov_ratio": 0.06251271705882386,
"_oov_charset": "[\"u\", \"¶\", \"İ\", \"ς\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"9\", \"à\", \"☺\", \"ć\", \"¼\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"x\", \"Ø\", \"😀\", \"😦\", \"y\", \"τ\", \"X\", \"û\", \"H\", \"å\", \"ó\", \"I\", \"h\", \"\", \"‹\", \"č\", \"£\", \"á\", \"▼\", \"…\", \"♥\", \"â\", \"R\", \"œ\", \"ç\", \"ε\", \"Ã\", \"ρ\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"¹\", \"ú\", \"\", \"b\", \"�\", \"ń\", \"½\", \"™\", \"≠\", \"ί\", \"★\", \"̈\", \"🙂\", \"E\", \"♡\", \"😂\", \"↩\", \"f\", \"U\", \"É\", \"S\", \"α\", \"ι\", \"W\", \"T\", \"ö\", \"Y\", \"5\", \"A\", \"¬\", \"😈\", \"K\", \"L\", \"é\", \"k\", \"❤\", \"ė\", \"›\", \"🙄\", \"Q\", \"Ö\", \"l\", \"ü\", \"s\", \"😆\", \"\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"0\", \"²\", \"g\", \"J\", \"\", \"š\", \"B\", \"P\", \"p\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"n\", \"↑\", \"Z\", \"♦\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/en": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1124813,
"_n_tokens": 326111,
"_n_chars": 1121360,
"_n_oov_chars": 31208,
"oov_ratio": 0.02783049154597988,
"_oov_charset": "[\"V\", \"U\", \"I\", \"③\", \"S\", \"0\", \"£\", \"⑧\", \"¦\", \"W\", \"T\", \"N\", \"G\", \"9\", \"\", \"Y\", \"…\", \"8\", \"M\", \"è\", \"5\", \"⑦\", \"7\", \"A\", \"D\", \"K\", \"J\", \"L\", \"‑\", \"é\", \"R\", \"P\", \"B\", \"Q\", \"😉\", \"X\", \"ï\", \"H\", \"\", \"1\", \"😥\", \"F\", \"C\", \"⑤\", \"2\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"Z\", \"4\", \"´\", \"6\", \"\", \"O\", \"3\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/es": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1664455,
"_n_tokens": 547112,
"_n_chars": 1630297,
"_n_oov_chars": 69589,
"oov_ratio": 0.04268486048861036,
"_oov_charset": "[\"¿\", \"N\", \"G\", \"à\", \"9\", \"M\", \"è\", \"D\", \"😀\", \"Í\", \"😦\", \"ò\", \"X\", \"º\", \"H\", \"ª\", \"Ñ\", \"✪\", \"\", \"👏\", \"ó\", \"I\", \"ý\", \"á\", \"️\", \"…\", \"í\", \"7\", \"R\", \"▷\", \"😉\", \"\", \"ñ\", \"C\", \"F\", \"ú\", \"✔\", \"Ú\", \"🙂\", \"✖\", \"E\", \"✓\", \"U\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"ö\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"❤\", \"\", \"Q\", \"ü\", \"👍\", \"2\", \"´\", \"ô\", \"O\", \"Ó\", \"М\", \"V\", \"′\", \"←\", \"Á\", \"\", \"0\", \"²\", \"J\", \"\", \"P\", \"B\", \"🙁\", \"1\", \"″\", \"―\", \"Z\", \"4\", \"6\", \"3\", \"v\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/fa": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2054052,
"_n_tokens": 254012,
"_n_chars": 1145876,
"_n_oov_chars": 1020760,
"oov_ratio": 0.8908119203124946,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"N\", \"G\", \"9\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"I\", \"h\", \"✿\", \"m\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"v\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"K\", \"L\", \"t\", \"o\", \"k\", \"\", \"❤\", \"ڪ\", \"c\", \"›\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"ـ\", \"●\", \"O\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"Z\", \"6\", \"4\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/fr": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1540504,
"_n_tokens": 496764,
"_n_chars": 1484970,
"_n_oov_chars": 67859,
"oov_ratio": 0.04569721947244725,
"_oov_charset": "[\"u\", \"♠\", \"N\", \"Â\", \"G\", \"à\", \"r\", \"è\", \"M\", \"À\", \"D\", \"x\", \"😀\", \"ã\", \"Ê\", \"X\", \"û\", \"H\", \"Ô\", \"Ç\", \"I\", \"h\", \"…\", \"í\", \"â\", \"℃\", \"ğ\", \"R\", \"œ\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"♕\", \"\", \"F\", \"C\", \"™\", \"b\", \"�\", \"̂\", \"★\", \"🙂\", \"E\", \"f\", \"U\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"A\", \"K\", \"L\", \"́\", \"é\", \"❤\", \"c\", \"Q\", \"ü\", \"🤔\", \"ê\", \"´\", \"ô\", \"O\", \"V\", \"←\", \"Î\", \"²\", \"ù\", \"g\", \"̧\", \"J\", \"µ\", \"\", \"P\", \"B\", \"″\", \"
\", \"ä\", \"È\", \"―\", \"Z\", \"v\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/ja": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1774770,
"_n_tokens": 317535,
"_n_chars": 603065,
"_n_oov_chars": 592607,
"oov_ratio": 0.9826585857245902,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"G\", \"又\", \"族\", \"青\", \"C\", \"王\", \"多\", \"婆\", \"D\", \"ラ\", \"ぃ\", \"✨\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \".\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"竹\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"示\", \"馬\", \"服\", \"腎\", \"皿\", \"態\", \"・\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"…\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"三\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"小\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"代\", \"箭\", \"喜\", \"g\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"氏\", \"紹\", \"城\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"―\", \"布\", \"杏\", \"歓\", \"撮\", \"部\", \"網\", \"間\", \"郷\", \"車\", \"タ\", \"閉\", \"教\", \"有\", \"八\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"陽\", \"貧\", \"余\", \"派\", \"西\", \"河\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"忠\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"→\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"宣\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"場\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"崎\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"的\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"「\", \"靴\", \"司\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"滝\", \"橋\", \"問\", \"旦\", \"副\", \"1\", \"核\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"v\", \"艦\", \"麓\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"秀\", \"完\", \"限\", \"学\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"地\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"行\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"本\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"鈴\", \"憤\", \"プ\", \"讐\", \",\", \"F\", \"令\", \"嫁\", \"頷\", \"盤\", \"松\", \"術\", \"治\", \"純\", \"薙\", \"遠\", \"国\", \"標\", \"算\", \"民\", \"店\", \"女\", \"則\", \"史\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"K\", \"曲\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"川\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"ヒ\", \"傘\", \"書\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"耳\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"p\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"介\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"?\", \"詐\", \"u\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"r\", \"索\", \"戦\", \"啓\", \"垠\", \"窪\", \"〆\", \"十\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"楊\", \"匡\", \"h\", \"浄\", \"止\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"北\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"文\", \"ヶ\", \"ε\", \"設\", \"幕\", \"不\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"秋\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"天\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"W\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"c\", \"l\", \"公\", \"凱\", \"疇\", \"帝\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"光\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"J\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"e\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"明\", \"庁\", \"藤\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"エ\", \"著\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"道\", \"a\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"I\", \"潟\", \"壊\", \"m\", \"犬\", \"勝\", \"恒\", \"傾\", \"巨\", \"。\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"吉\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"健\", \"銃\", \"閣\", \"衷\", \"点\", \"S\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"」\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"岡\", \"´\", \"鋲\", \"永\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"侍\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"男\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"朝\", \"支\", \"乏\", \"佇\", \"攻\", \"戸\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"4\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"志\", \"勘\", \"兎\", \"葉\", \"爾\", \"ㅂ\", \"を\", \"還\", \"版\", \"ム\", \"規\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"井\", \"汗\", \"黄\", \"春\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"-\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"四\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"力\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"U\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"o\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"我\", \"ス\", \"樹\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"伊\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"ハ\", \"蛇\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"家\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"年\", \"茨\", \"N\", \"途\", \"纏\", \"他\", \"お\", \"云\", \"農\", \"N\", \"阿\", \"貴\", \"赦\", \"要\", \"弁\", \"金\", \"貸\", \"雄\", \"脇\", \"矢\", \"任\", \"ぴ\", \"東\", \"愕\", \"漫\", \"\", \"拷\", \"一\", \"飾\", \"慮\", \"糖\", \"宮\", \"貌\", \"郵\", \"谷\", \"鎖\", \"カ\", \"法\", \"該\", \"方\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"幸\", \"ゆ\", \"写\", \"博\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"C\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"島\", \"唇\", \"伏\", \"姥\", \"営\", \"E\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"8\", \"革\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"和\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"千\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"林\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"清\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"q\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"d\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"〈\", \"唱\", \"再\", \"桁\", \"😭\", \"Ⅶ\", \"ア\", \"子\", \"会\", \"数\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"國\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"原\", \"州\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"安\", \"掃\", \"極\", \"胚\", \"発\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"j\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"皇\", \"被\", \"外\", \"痴\", \"塵\", \"U\", \"李\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"A\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"品\", \"練\", \"詞\", \"ふ\", \"〉\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"坂\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \")\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"成\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"3\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"門\", \"ァ\", \"針\", \"資\", \"沢\", \"丁\", \"腫\", \"仁\", \"激\", \"x\", \"須\", \"泥\", \"立\", \"臆\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"平\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"五\", \"引\", \"暦\", \"来\", \"栽\", \"ズ\", \"蒙\", \"倍\", \"之\", \"球\", \"瓦\", \"舞\", \"歪\", \"堂\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"空\", \"呂\", \"f\", \"斧\", \"才\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"上\", \"洒\", \"〜\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"香\", \"侵\", \"客\", \"移\", \"結\", \"陳\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"O\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"佐\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"信\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"夏\", \"助\", \"丼\", \"ダ\", \"区\", \"n\", \"賛\", \"背\", \"預\", \"顔\", \"同\", \"工\", \"朗\", \"炉\", \"賭\", \"白\", \"蠍\", \"9\", \"M\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"y\", \"倫\", \"稀\", \"散\", \"H\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"ケ\", \"略\", \"森\", \"課\", \"呆\", \"料\", \"悶\", \"先\", \"浴\", \"恰\", \"墜\", \"新\", \"生\", \"7\", \"纒\", \"南\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"《\", \"ゥ\", \"哀\", \"尽\", \"出\", \"劉\", \"合\", \"ま\", \"割\", \"且\", \"状\", \"政\", \"仲\", \"沸\", \"∇\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"ω\", \"末\", \"腔\", \"水\", \"電\", \"¥\", \"煮\", \"採\", \"重\", \"施\", \"口\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"B\", \"P\", \"^\", \"遥\", \"税\", \"句\", \"睦\", \"丘\", \"山\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"名\", \"懸\", \"提\", \"昇\", \"久\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"宇\", \"策\", \"ノ\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"石\", \"低\", \"相\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"都\", \"奈\", \"じ\", \"捏\", \"漏\", \"烈\", \"古\", \"■\", \"磨\", \"長\", \"⇒\", \"弥\", \"忙\", \"應\", \"桑\", \"龍\", \"摩\", \"慈\", \"崔\", \"挫\", \"英\", \"勉\", \"ワ\", \"↓\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"、\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"z\", \"幣\", \"見\", \"正\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"Q\", \"報\", \"況\", \"J\", \"s\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"2\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"街\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"火\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"土\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"(\", \"指\", \"能\", \"6\", \"村\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"後\", \" \", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"食\", \"署\", \"摘\", \"─\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"i\", \"循\", \"®\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"御\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"貝\", \"尚\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"木\", \"頓\", \"菊\", \"華\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"社\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"比\", \"b\", \"窒\", \"至\", \"夫\", \"綬\", \"鼓\", \"亭\", \"ホ\", \"揉\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"軍\", \"内\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"也\", \"狩\", \"歌\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"前\", \"詩\", \"0\", \"傷\", \"曹\", \"や\", \"》\", \"箇\", \"園\", \"瞑\", \"義\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"保\", \"執\", \"楓\", \"w\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"武\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"郎\", \"射\", \"嶽\", \"槃\", \"允\", \"綜\", \"瀬\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"宗\", \"に\", \"鹿\", \"豪\", \"捕\", \"X\", \"逆\", \"郡\", \"日\", \"吹\", \"寺\", \"絞\", \"騰\", \"江\", \"礁\", \"甚\", \"婚\", \"美\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"−\", \"澪\", \"筋\", \"情\", \"典\", \"良\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"省\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"/\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"氷\", \"次\", \"ガ\", \"[\", \"海\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"大\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"Z\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"定\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"分\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"風\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"元\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"京\", \"逸\", \"篤\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"T\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"5\", \"編\", \"心\", \"腹\", \"L\", \"郭\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"章\", \"月\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"高\", \"贅\", \"随\", \"捺\", \"ト\", \"加\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"田\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"漢\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"野\", \"ャ\", \"娠\", \"烙\", \"Y\", \"鞄\", \"締\", \"昭\", \"e\", \"簡\", \"最\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"太\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"』\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \":\", \"V\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"手\", \"〟\", \"世\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"!\", \"啜\", \"人\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"″\", \"叫\", \"株\", \"丸\", \"↑\", \"俳\", \"蝶\", \"条\", \"荘\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"士\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"『\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"花\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"事\", \"宿\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"面\", \"主\", \"R\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"‐\", \"m\", \"中\", \"措\", \"語\", \"謬\", \"洩\", \"獄\", \"黙\", \"里\", \"厚\", \"★\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"ウ\", \"用\", \"拶\", \"星\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"真\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"仮\", \"二\", \"頬\", \"邸\", \"目\", \"瑞\", \"t\", \"」\", \"尋\", \"尺\", \"果\", \"k\", \"景\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"張\", \"在\", \"煩\", \"榴\", \"愛\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"下\", \"販\", \"訃\", \"裂\", \"神\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/ko": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 1524839,
"_n_tokens": 201519,
"_n_chars": 655190,
"_n_oov_chars": 492345,
"oov_ratio": 0.7514537767670447,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"族\", \"王\", \"갈\", \"싱\", \"체\", \"多\", \"D\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"竹\", \"백\", \"\", \"규\", \"德\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"三\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"代\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"城\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"部\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"有\", \"八\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"的\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"′\", \"엎\", \"귈\", \"캣\", \"튼\", \"「\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"1\", \"숏\", \"福\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"地\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"行\", \"벽\", \"甲\", \"£\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"F\", \"컸\", \"治\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"民\", \"女\", \"뜯\", \"략\", \"史\", \"따\", \"틸\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"川\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"十\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"北\", \"갯\", \"틴\", \"채\", \"앎\", \"文\", \"싹\", \"늬\", \"둡\", \"不\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"秋\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"天\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"公\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"帝\", \"☆\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"光\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"明\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"道\", \"쳤\", \"a\", \"孝\", \"敬\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"犬\", \"확\", \"꾀\", \"잴\", \"똘\", \"。\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"±\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"S\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"」\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"永\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"男\", \"朝\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"志\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"春\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"家\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"年\", \"途\", \"戊\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"金\", \"貸\", \"꾸\", \"雄\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"一\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"谷\", \"폄\", \"눔\", \"法\", \"方\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"C\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"8\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"和\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"林\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"〈\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"子\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"國\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"原\", \"믿\", \"팩\", \"싸\", \"움\", \"安\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"j\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"皇\", \"둬\", \"식\", \"被\", \"外\", \"얄\", \"앰\", \"림\", \"蚩\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"〉\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"仁\", \"놨\", \"x\", \"됬\", \"立\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"平\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"五\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"之\", \"원\", \"갱\", \"레\", \"堂\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"f\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"上\", \"푸\", \"客\", \"結\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"信\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"同\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"白\", \"9\", \"M\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"新\", \"미\", \"生\", \"ⅲ\", \"7\", \"상\", \"짱\", \"南\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"《\", \"哀\", \"획\", \"뭉\", \"出\", \"젝\", \"合\", \"쩌\", \"탓\", \"페\", \"政\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"ω\", \"🤕\", \"水\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"口\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"山\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"相\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"古\", \"■\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"摩\", \"묵\", \"英\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"正\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"Q\", \"劫\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"火\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"土\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"6\", \"常\", \"납\", \"後\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"食\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"i\", \"侯\", \"강\", \"뛸\", \"색\", \"御\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"好\", \"韜\", \"華\", \"ㅅ\", \"社\", \"큐\", \"얽\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"比\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"0\", \"》\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"武\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"宗\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"日\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"江\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"美\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"海\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"大\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"分\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"京\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"心\", \"L\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"章\", \"月\", \"완\", \"딸\", \"高\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"し\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"≤\", \"す\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"野\", \"직\", \"Y\", \"답\", \"昭\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"』\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"手\", \"껑\", \"땡\", \"돼\", \"世\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"人\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"『\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"事\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"面\", \"R\", \"主\", \"웠\", \"適\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"中\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"里\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"星\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"目\", \"t\", \"」\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"下\", \"는\", \"神\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"dbmdz/bert-base-german-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-german-uncased",
"organization": "dbmdz",
"vocab_size": 31102,
"_n_bytes": 2633047,
"_n_tokens": 879155,
"_n_chars": 927311,
"_n_oov_chars": 870721,
"oov_ratio": 0.9389740874420771,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"G\", \"又\", \"鱼\", \"族\", \"青\", \"⒀\", \"撬\", \"C\", \"王\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"D\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \".\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"竹\", \"页\", \"狸\", \"挈\", \"\", \"贵\", \"噌\", \"德\", \"贱\", \"杆\", \"浙\", \"汐\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"示\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"・\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"…\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"三\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"小\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"代\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"氏\", \"城\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"―\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"部\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"吆\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"有\", \"八\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"τ\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"西\", \"河\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"忠\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"氰\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"宣\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"近\", \"培\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"崎\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"的\", \"杭\", \"【\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"●\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"「\", \"偿\", \"衬\", \"撐\", \"靴\", \"司\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"1\", \"笃\", \"核\", \"找\", \"闻\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"麓\", \"栖\", \"瞠\", \"葆\", \"潭\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"秀\", \"陵\", \"戳\", \"完\", \"戾\", \"限\", \"学\", \"冯\", \"睐\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"地\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"~\", \"陈\", \"裙\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"行\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"本\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"锥\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \",\", \"F\", \"令\", \"嫁\", \"松\", \"治\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"国\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"民\", \"店\", \"嫂\", \"女\", \"书\", \"跃\", \"耙\", \"史\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"K\", \"痊\", \"曲\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"川\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"耳\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"介\", \"骰\", \"捧\", \"体\", \"?\", \"疼\", \"邻\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"十\", \"梦\", \"增\", \"沾\", \"渠\", \"饰\", \"Ø\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"止\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"ὐ\", \"北\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"文\", \"冰\", \"蜴\", \"甜\", \"炙\", \"幕\", \"不\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"秋\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"天\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"W\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"公\", \"蟀\", \"馍\", \"咐\", \"帝\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"←\", \"锅\", \"勃\", \"样\", \"光\", \"幅\", \"卷\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"J\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"瘀\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"明\", \"藤\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"廉\", \"道\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"I\", \"乒\", \"莘\", \"螃\", \"犬\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"。\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"吉\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"健\", \"嗨\", \"D\", \"衷\", \"点\", \"S\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"」\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"永\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"侍\", \"刊\", \"苛\", \"础\", \"佘\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"の\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"男\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"朝\", \"读\", \"蹒\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"戸\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"4\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"志\", \"较\", \"笛\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"版\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"井\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"嘤\", \"严\", \"春\", \"睑\", \"骏\", \"颉\", \"与\", \"骸\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"-\", \"偶\", \"莓\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"四\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"力\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"U\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"我\", \"煎\", \"颖\", \"九\", \"ê\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"伊\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"ù\", \"家\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"年\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"N\", \"阿\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"金\", \"呦\", \"估\", \"值\", \"雄\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"一\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"谷\", \"厮\", \"枉\", \"纷\", \"法\", \"婶\", \"方\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"幸\", \"写\", \"博\", \"补\", \"夕\", \"匾\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"C\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"E\", \"辈\", \"绽\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"8\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"é\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"價\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"和\", \"预\", \"娄\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"千\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"林\", \"瀚\", \"璃\", \"利\", \"矶\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"清\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"雳\", \"涕\", \"葩\", \"掠\", \"靛\", \"付\", \"豚\", \"为\", \"昊\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"〈\", \"摞\", \"霸\", \"唱\", \"再\", \"蟋\", \"郴\", \"徇\", \"异\", \"子\", \"会\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"á\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"原\", \"州\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"へ\", \"安\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"皇\", \"列\", \"阜\", \"珊\", \"麾\", \"被\", \"稍\", \"外\", \"痴\", \"阂\", \"裔\", \"胀\", \"李\", \"论\", \"首\", \"α\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"A\", \"洗\", \"纹\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"品\", \"〉\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"坂\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \")\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"成\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"蹴\", \"3\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"ς\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"門\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"仁\", \"激\", \"臆\", \"泥\", \"立\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"平\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"五\", \"引\", \"袍\", \"来\", \"锤\", \"畑\", \"讪\", \"忿\", \"疵\", \"ズ\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"之\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"堂\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"空\", \"赞\", \"動\", \"才\", \"斧\", \"翅\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"上\", \"绞\", \"洒\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"香\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"龚\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"O\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"佐\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"ο\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"信\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"夏\", \"助\", \"扣\", \"锂\", \"区\", \"捂\", \"芬\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"同\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"白\", \"梵\", \"9\", \"攸\", \"岑\", \"涉\", \"晰\", \"刚\", \"蝉\", \"M\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"H\", \"硕\", \"篷\", \"玉\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"漠\", \"哒\", \"畜\", \"伫\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"森\", \"柳\", \"料\", \"虽\", \"先\", \"呆\", \"浴\", \"俨\", \"鄯\", \"恰\", \"镉\", \"欢\", \"殉\", \"新\", \"办\", \"臂\", \"生\", \"惟\", \"7\", \"扼\", \"南\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"î\", \"遂\", \"《\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"出\", \"合\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"政\", \"状\", \"仲\", \"沸\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"水\", \"偎\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"\", \"施\", \"口\", \"载\", \"炸\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"P\", \"莴\", \"B\", \"税\", \"遥\", \"犀\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"山\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"名\", \"肃\", \"舆\", \"谬\", \"提\", \"军\", \"撞\", \"久\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"宇\", \"策\", \"瑨\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"石\", \"弈\", \"帜\", \"低\", \"动\", \"奸\", \"相\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"都\", \"泛\", \"奈\", \"喧\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"古\", \"广\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"弘\", \"挫\", \"饷\", \"英\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"、\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"后\", \"蠢\", \"锐\", \"正\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"Q\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"2\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"街\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"火\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"土\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"(\", \"指\", \"能\", \"沧\", \"6\", \"村\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \" \", \"檀\", \"血\", \"後\", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"必\", \"均\", \"无\", \"食\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"─\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"踱\", \"峨\", \"茄\", \"仕\", \"庄\", \"急\", \"浆\", \"舶\", \"桓\", \"进\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"御\", \"辩\", \"朔\", \"柠\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"尚\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"疹\", \"评\", \"好\", \"木\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"勇\", \"择\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"社\", \"岁\", \"战\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"比\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"夫\", \"鼓\", \"舰\", \"诫\", \"伉\", \"亭\", \"曾\", \"揉\", \"茂\", \"皙\", \"旷\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"内\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"也\", \"蚀\", \"狩\", \"歌\", \"啪\", \"聂\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"前\", \"唉\", \"0\", \"剔\", \"曹\", \"》\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"保\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"武\", \"固\", \"玄\", \"禾\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"郎\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"宗\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"X\", \"咖\", \"薯\", \"郡\", \"逆\", \"日\", \"传\", \"吹\", \"寺\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"江\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"ě\", \"莫\", \"美\", \"婚\", \"迭\", \"鹑\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"良\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"省\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"/\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"海\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"大\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"Z\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"定\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"分\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"元\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"京\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"T\", \"印\", \"○\", \"迩\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"5\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"心\", \"腹\", \"L\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"▪\", \"憋\", \"阎\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"月\", \"奥\", \"章\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"高\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"ト\", \"奖\", \"加\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"ç\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"田\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"野\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"Y\", \"绰\", \"苏\", \"e\", \"昭\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"太\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"』\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \":\", \"V\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"手\", \"溉\", \"摹\", \"拆\", \"瞪\", \"世\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"!\", \"啜\", \"人\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"↑\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"士\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"à\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"『\", \"膜\", \"邂\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"花\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"镇\", \"峻\", \"事\", \"眯\", \"晨\", \"宿\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"面\", \"R\", \"主\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"中\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"里\", \"搜\", \"芙\", \"厚\", \"★\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"星\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"真\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"二\", \"邸\", \"膳\", \"对\", \"目\", \"瑞\", \"测\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"擂\", \"何\", \"遮\", \"ό\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"下\", \"马\", \"裂\", \"瀛\", \"皑\", \"神\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"deepseek-ai/DeepSeek-V2 @ cc100/ar": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2813283,
"_n_tokens": 1416103,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/de": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1814876,
"_n_tokens": 631152,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/en": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1124813,
"_n_tokens": 262324,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/es": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1664455,
"_n_tokens": 470524,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/fa": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2054052,
"_n_tokens": 963451,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/fr": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1540504,
"_n_tokens": 497667,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/ja": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1774770,
"_n_tokens": 751467,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/ko": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 1524839,
"_n_tokens": 1071983,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/DeepSeek-V2 @ cc100/zh-Hans": {
"tokenizer": "DeepSeek-V2",
"organization": "DeepSeek",
"vocab_size": 100002,
"_n_bytes": 2633047,
"_n_tokens": 595081,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ar": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2813283,
"_n_tokens": 1948863,
"_n_chars": 1560987,
"_n_oov_chars": 1,
"oov_ratio": 6.406203254735626e-07,
"_oov_charset": "[\"ö\"]",
"reversible": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/de": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1814876,
"_n_tokens": 735618,
"_n_chars": 1784021,
"_n_oov_chars": 13536,
"oov_ratio": 0.007587354633157345,
"_oov_charset": "[\"ø\", \"ö\", \"ú\", \"ü\", \"Á\", \"û\"]",
"reversible": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/en": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1124813,
"_n_tokens": 277408,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/es": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1664455,
"_n_tokens": 513884,
"_n_chars": 1630297,
"_n_oov_chars": 1637,
"oov_ratio": 0.0010041115207842497,
"_oov_charset": "[\"ø\", \"ö\", \"ú\", \"ý\", \"ü\", \"Á\"]",
"reversible": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/fa": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2054052,
"_n_tokens": 1316109,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/fr": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1540504,
"_n_tokens": 527538,
"_n_chars": 1484970,
"_n_oov_chars": 557,
"oov_ratio": 0.00037509175269534066,
"_oov_charset": "[\"À\", \"û\", \"ü\", \"ù\"]",
"reversible": false
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ja": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1774770,
"_n_tokens": 1008060,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/ko": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 1524839,
"_n_tokens": 1444805,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-coder-33b-instruct @ cc100/zh-Hans": {
"tokenizer": "deepseek-coder-33b-instruct",
"organization": "DeepSeek",
"vocab_size": 32022,
"_n_bytes": 2633047,
"_n_tokens": 710577,
"_n_chars": 927311,
"_n_oov_chars": 1,
"oov_ratio": 1.0783868626598843e-06,
"_oov_charset": "[\"ù\"]",
"reversible": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ar": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2813283,
"_n_tokens": 1416103,
"_n_chars": 1560987,
"_n_oov_chars": 1,
"oov_ratio": 6.406203254735626e-07,
"_oov_charset": "[\"ö\"]",
"reversible": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/de": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1814876,
"_n_tokens": 632573,
"_n_chars": 1784021,
"_n_oov_chars": 13536,
"oov_ratio": 0.007587354633157345,
"_oov_charset": "[\"ø\", \"ö\", \"ú\", \"ü\", \"Á\", \"û\"]",
"reversible": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/en": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1124813,
"_n_tokens": 262324,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/es": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1664455,
"_n_tokens": 470877,
"_n_chars": 1630297,
"_n_oov_chars": 1637,
"oov_ratio": 0.0010041115207842497,
"_oov_charset": "[\"ø\", \"ö\", \"ú\", \"ý\", \"ü\", \"Á\"]",
"reversible": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/fa": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2054052,
"_n_tokens": 963451,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/fr": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1540504,
"_n_tokens": 497693,
"_n_chars": 1484970,
"_n_oov_chars": 557,
"oov_ratio": 0.00037509175269534066,
"_oov_charset": "[\"À\", \"û\", \"ü\", \"ù\"]",
"reversible": false
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ja": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1774770,
"_n_tokens": 751467,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/ko": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 1524839,
"_n_tokens": 1071983,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"deepseek-ai/deepseek-llm-7b-base @ cc100/zh-Hans": {
"tokenizer": "deepseek-llm-7b-base",
"organization": "DeepSeek",
"vocab_size": 100015,
"_n_bytes": 2633047,
"_n_tokens": 595081,
"_n_chars": 927311,
"_n_oov_chars": 1,
"oov_ratio": 1.0783868626598843e-06,
"_oov_charset": "[\"ù\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/ar": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2813283,
"_n_tokens": 311987,
"_n_chars": 1560987,
"_n_oov_chars": 1353091,
"oov_ratio": 0.8668175968153482,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"9\", \"G\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"×\", \"ۤ\", \"د\", \"۰\", \"d\", \"y\", \"٨\", \"X\", \"▫\", \"i\", \"®\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"a\", \"ٌ\", \"😊\", \"ج\", \"I\", \"h\", \"¡\", \"m\", \"\", \"♥\", \"ن\", \"7\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"b\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"v\", \"S\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"k\", \"\", \"Х\", \"﴿\", \"c\", \"؛\", \"Q\", \"٠\", \"l\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"V\", \"٧\", \"۷\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"B\", \"P\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"ä\", \"ص\", \"ّ\", \"ث\", \"n\", \"4\", \"6\", \"Z\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/de": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1814876,
"_n_tokens": 769053,
"_n_chars": 1784021,
"_n_oov_chars": 111086,
"oov_ratio": 0.06226720425376159,
"_oov_charset": "[\"©\", \"u\", \"¶\", \"İ\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"à\", \"☺\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"x\", \"Ø\", \"😀\", \"‚\", \"😦\", \"y\", \"X\", \"û\", \"H\", \"å\", \"ó\", \"I\", \"h\", \"\", \"č\", \"á\", \"♥\", \"â\", \"R\", \"œ\", \"ç\", \"Ã\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"™\", \"ú\", \"\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"̈\", \"🙂\", \"E\", \"😂\", \"↩\", \"f\", \"U\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"A\", \"¬\", \"😈\", \"K\", \"L\", \"é\", \"k\", \"❤\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"l\", \"ü\", \"s\", \"😆\", \"\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"g\", \"J\", \"\", \"š\", \"B\", \"P\", \"`\", \"p\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"n\", \"Z\", \"♦\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/en": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1124813,
"_n_tokens": 373564,
"_n_chars": 1121360,
"_n_oov_chars": 31094,
"oov_ratio": 0.027728829278732967,
"_oov_charset": "[\"V\", \"U\", \"I\", \"¡\", \"S\", \"¦\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"‑\", \"é\", \"R\", \"P\", \"B\", \"Q\", \"😉\", \"X\", \"ï\", \"®\", \"H\", \"\", \"😥\", \"F\", \"C\", \"ñ\", \"\", \"\", \"�\", \"Z\", \"´\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/es": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1664455,
"_n_tokens": 684804,
"_n_chars": 1630297,
"_n_oov_chars": 69237,
"oov_ratio": 0.04246894890930916,
"_oov_charset": "[\"✓\", \"V\", \"©\", \"М\", \"U\", \"I\", \"v\", \"É\", \"¡\", \"ý\", \"Á\", \"S\", \"\", \"¿\", \"á\", \"N\", \"T\", \"G\", \"à\", \"W\", \"️\", \"Y\", \"ö\", \"í\", \"M\", \"è\", \"5\", \"A\", \"D\", \"z\", \"K\", \"J\", \"L\", \"é\", \"R\", \"\", \"▷\", \"P\", \"B\", \"😀\", \"Í\", \"❤\", \"\", \"😦\", \"Q\", \"😉\", \"ò\", \"ü\", \"X\", \"🙁\", \"👍\", \"®\", \"H\", \"ª\", \"1\", \"\", \"ñ\", \"C\", \"F\", \"Ñ\", \"ú\", \"✔\", \"\", \"Ú\", \"👏\", \"´\", \"Z\", \"4\", \"ô\", \"O\", \"Ó\", \"3\", \"🙂\", \"✖\", \"ó\", \"E\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/fa": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2054052,
"_n_tokens": 254671,
"_n_chars": 1145876,
"_n_oov_chars": 1018200,
"oov_ratio": 0.8885778216840217,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"N\", \"G\", \"9\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"I\", \"h\", \"m\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"♥\", \"ن\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"v\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"K\", \"L\", \"t\", \"o\", \"k\", \"\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"ـ\", \"O\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"Z\", \"6\", \"4\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/fr": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1540504,
"_n_tokens": 618107,
"_n_chars": 1484970,
"_n_oov_chars": 66988,
"oov_ratio": 0.04511067563654485,
"_oov_charset": "[\"u\", \"♠\", \"N\", \"Â\", \"G\", \"à\", \"r\", \"è\", \"M\", \"À\", \"D\", \"x\", \"😀\", \"ã\", \"Ê\", \"X\", \"û\", \"®\", \"H\", \"Ô\", \"Ç\", \"I\", \"h\", \"í\", \"â\", \"ğ\", \"R\", \"œ\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"♕\", \"\", \"F\", \"C\", \"™\", \"b\", \"�\", \"̂\", \"🙂\", \"E\", \"f\", \"U\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"A\", \"K\", \"L\", \"́\", \"é\", \"k\", \"❤\", \"c\", \"Q\", \"ü\", \"🤔\", \"ê\", \"2\", \"´\", \"ô\", \"O\", \"V\", \"Î\", \"ù\", \"̧\", \"J\", \"\", \"P\", \"B\", \"
\", \"ä\", \"È\", \"Z\", \"v\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/ja": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1774770,
"_n_tokens": 318023,
"_n_chars": 603065,
"_n_oov_chars": 420994,
"oov_ratio": 0.6980905872501306,
"_oov_charset": "[\"a\", \"ー\", \"濫\", \"③\", \"蛍\", \"ペ\", \"嶽\", \"サ\", \"綜\", \"監\", \"9\", \"G\", \"セ\", \"慄\", \"f\", \"C\", \"e\", \"門\", \"釘\", \"め\", \"ァ\", \"資\", \"録\", \"針\", \"紐\", \"ラ\", \"D\", \"ベ\", \"諸\", \"ぃ\", \"x\", \"嘗\", \"載\", \"細\", \"よ\", \"須\", \"塗\", \"ハ\", \"飽\", \"膚\", \"に\", \".\", \"疎\", \"綾\", \"絡\", \"ヲ\", \"X\", \"僕\", \"妬\", \"I\", \"穫\", \"エ\", \"鉢\", \"欝\", \"噴\", \"聖\", \"絞\", \"損\", \"騰\", \"K\", \"貿\", \"貰\", \"蓮\", \"競\", \"別\", \"誠\", \"ぅ\", \"t\", \"a\", \"嘆\", \"R\", \"喩\", \"馬\", \"ク\", \"ィ\", \"導\", \"腎\", \"I\", \"嗚\", \"態\", \"・\", \"m\", \"筈\", \"勝\", \"オ\", \"撫\", \"罰\", \"讃\", \"糞\", \"て\", \"傾\", \"−\", \"¥\", \"澪\", \"夢\", \"🌙\", \"衝\", \"誘\", \"ょ\", \"話\", \"d\", \"縮\", \"遺\", \"協\", \"婦\", \"暦\", \"G\", \"ズ\", \"F\", \"緩\", \">\", \"認\", \"箋\", \"謳\", \"暁\", \"✨\", \"ロ\", \"靄\", \"債\", \"②\", \"師\", \"優\", \"犠\", \"時\", \"ぉ\", \"糾\", \"獲\", \"雲\", \"動\", \"呂\", \"財\", \"f\", \"ド\", \"為\", \"燭\", \"項\", \"銃\", \"゚\", \"藁\", \"鎮\", \"閣\", \"S\", \"轢\", \"暢\", \"穢\", \"視\", \"紙\", \"穏\", \"離\", \"\\", \"揚\", \"薦\", \"選\", \"論\", \"و\", \"擁\", \"鍋\", \"桟\", \"揮\", \"暫\", \"鳴\", \"ヵ\", \"&\", \"偉\", \"輩\", \"イ\", \"結\", \"韮\", \"陳\", \"詠\", \"決\", \"淵\", \"べ\", \"ゝ\", \"ヘ\", \"館\", \"コ\", \"謗\", \"渓\", \"ど\", \"誌\", \"診\", \"紅\", \"猟\", \"阪\", \"帳\", \"臨\", \"蘇\", \"瘍\", \"岡\", \"´\", \"ぽ\", \"緑\", \"鋲\", \"O\", \"瘻\", \"ゲ\", \"測\", \"礎\", \"槍\", \"る\", \"違\", \"頻\", \"ニ\", \"0\", \"嵐\", \"儀\", \"%\", \"キ\", \"貨\", \"マ\", \"|\", \"ご\", \"ュ\", \"/\", \"躊\", \"の\", \"慣\", \"パ\", \"審\", \"級\", \"侶\", \"g\", \"S\", \"゚\", \"[\", \"ガ\", \"礫\", \"勲\", \"億\", \"ぬ\", \"b\", \"訝\", \"臥\", \"X\", \"`\", \"計\", \"綴\", \"喪\", \"陣\", \"紹\", \"週\", \"佇\", \"轄\", \"隊\", \"敗\", \"輪\", \"躾\", \"騒\", \"賃\", \"っ\", \"棟\", \"貪\", \"ダ\", \"♪\", \"務\", \"許\", \"n\", \"✧\", \"4\", \"Z\", \"賛\", \"預\", \"顔\", \"④\", \"網\", \"間\", \"鶴\", \"]\", \"∀\", \"賭\", \"袴\", \"車\", \"鮮\", \"兎\", \"タ\", \"9\", \"彡\", \"鴻\", \"葉\", \"閉\", \"爾\", \"ㅂ\", \"を\", \"鳥\", \"M\", \"ナ\", \"還\", \"涼\", \"蒔\", \"ぞ\", \"ム\", \"規\", \"酔\", \"姦\", \"於\", \"軒\", \"M\", \"織\", \"訊\", \"y\", \"墳\", \"倫\", \"陽\", \"貫\", \"貧\", \"H\", \"養\", \"談\", \"難\", \"辿\", \"く\", \"錠\", \"ゃ\", \"員\", \"錬\", \"貼\", \"孫\", \"並\", \"ジ\", \"粋\", \"鬱\", \"準\", \"緻\", \"レ\", \"ケ\", \"風\", \"課\", \"が\", \"懇\", \"-\", \"餌\", \"悶\", \"戯\", \"遊\", \"墜\", \"▼\", \"4\", \"→\", \"衆\", \"諺\", \"Z\", \"7\", \"纒\", \"達\", \"ゾ\", \"誹\", \"冊\", \"艸\", \"℃\", \"は\", \"呟\", \"絆\", \"幾\", \"個\", \"ぼ\", \"か\", \"▷\", \"殻\", \"ボ\", \"罠\", \"緒\", \"庫\", \"D\", \"\", \"え\", \"漬\", \"ゥ\", \"ビ\", \"7\", \"劉\", \"逡\", \"ま\", \"謡\", \"娯\", \"h\", \"�\", \"◇\", \"呑\", \"∇\", \"P\", \"=\", \"開\", \"篤\", \"み\", \"題\", \"♡\", \"聾\", \"ポ\", \"撲\", \"訓\", \"賊\", \"△\", \"U\", \"銘\", \"誤\", \"遡\", \"挿\", \"訟\", \"飼\", \"運\", \"場\", \"ブ\", \"閃\", \"T\", \"○\", \"諾\", \"⇔\", \"隕\", \"嘩\", \"詰\", \"鏡\", \"識\", \"5\", \"奪\", \"ギ\", \"編\", \"L\", \"́\", \"誰\", \"ン\", \"o\", \"缶\", \"馳\", \"鉛\", \"顎\", \"強\", \"⻑\", \"\\b\", \"き\", \"ぐ\", \"砕\", \"💦\", \"闊\", \"潰\", \"れ\", \"馴\", \"モ\", \"ヴ\", \"麗\", \"_\", \"訂\", \"づ\", \"濃\", \"ス\", \"樹\", \"請\", \"テ\", \"ヤ\", \"詫\", \"誕\", \"ゥ\", \"バ\", \"😢\", \"゙\", \"腫\", \"砦\", \"鋭\", \"●\", \"賢\", \"T\", \"績\", \"綺\", \"艶\", \"ハ\", \"梱\", \"係\", \"¥\", \"w\", \"電\", \"慶\", \"飲\", \"採\", \"趨\", \"俵\", \"ピ\", \"訪\", \"惣\", \"衛\", \"カ\", \"詈\", \"ひ\", \"駒\", \"併\", \"滅\", \"棄\", \"斂\", \"`\", \"捜\", \"順\", \"灘\", \"虜\", \"も\", \"ソ\", \"調\", \"ぇ\", \"♫\", \"B\", \"P\", \"^\", \"恥\", \"闖\", \"謀\", \"巣\", \"Д\", \"憂\", \"橋\", \"問\", \"デ\", \"懸\", \"1\", \"ノ\", \"僅\", \"ぁ\", \"贅\", \"ト\", \"ノ\", \"ろ\", \"ウ\", \"ぎ\", \"ば\", \"N\", \"v\", \"y\", \"艦\", \"纏\", \"©\", \"療\", \"給\", \"醤\", \"紋\", \"お\", \"ら\", \"5\", \"譜\", \"n\", \"憲\", \"懐\", \"*\", \"農\", \"N\", \"貴\", \"約\", \"饉\", \"L\", \"絶\", \"積\", \"び\", \"鵜\", \"貸\", \"産\", \"譚\", \"討\", \"軸\", \"陥\", \"Q\", \"×\", \"緯\", \"嚥\", \"ぴ\", \"渦\", \"備\", \"東\", \"し\", \"質\", \"製\", \"奨\", \"\", \"~\", \"謂\", \"縦\", \"腸\", \"紗\", \"側\", \"ゞ\", \"繊\", \"飾\", \"け\", \"慮\", \"頂\", \"駕\", \"宮\", \"髭\", \"じ\", \"郵\", \"災\", \"鎖\", \"カ\", \"欄\", \"該\", \"顕\", \"■\", \"と\", \"g\", \"<\", \"誇\", \"匂\", \"😊\", \"醸\", \"劇\", \"長\", \"⇒\", \"曇\", \"鐘\", \"應\", \"メ\", \"V\", \"ヌ\", \"龍\", \"蝋\", \"塚\", \"ゆ\", \"彙\", \"⑪\", \"職\", \"墾\", \"輸\", \"o\", \"ワ\", \"欽\", \"醜\", \"↓\", \"こ\", \"▽\", \"憶\", \"コ\", \"曖\", \"鈴\", \"◯\", \"贈\", \"憤\", \"プ\", \"讐\", \"〇\", \"ざ\", \"鱈\", \"F\", \"潔\", \"C\", \"壌\", \"O\", \"盤\", \"E\", \"術\", \"純\", \"頷\", \"Ⅹ\", \"島\", \"贔\", \"遠\", \"謙\", \"鶏\", \"ョ\", \"ぷ\", \"標\", \"終\", \"̈\", \"漢\", \"統\", \"E\", \"躍\", \"償\", \"3\", \"ッ\", \"倉\", \"親\", \"す\", \"則\", \"H\", \"噛\", \"綱\", \"塊\", \"峠\", \"ャ\", \"縫\", \"喚\", \"Y\", \"異\", \"ぜ\", \"8\", \"締\", \"鞄\", \"e\", \"捗\", \"z\", \"K\", \"簡\", \"幣\", \"領\", \"見\", \"負\", \"銀\", \"記\", \"‼\", \"ゅ\", \"ツ\", \"㎞\", \"頑\", \"構\", \"Q\", \"舘\", \"報\", \"複\", \"況\", \"J\", \"膿\", \"s\", \"ヽ\", \"潤\", \"縞\", \"\", \"だ\", \"機\", \"擬\", \"堅\", \"拠\", \"2\", \"̀\", \"ヒ\", \"傘\", \"書\", \"麹\", \"詮\", \"餃\", \"飴\", \"脈\", \"グ\", \"l\", \"V\", \"シ\", \"諦\", \"拝\", \"ィ\", \"贋\", \"猶\", \"額\", \"噂\", \"屓\", \"リ\", \"〟\", \"わ\", \"試\", \"創\", \" ̄\", \"貢\", \"熱\", \"貶\", \"ん\", \"鍛\", \"p\", \"唄\", \"過\", \"責\", \"組\", \"覗\", \"剰\", \"ォ\", \"渕\", \"飛\", \"費\", \"チ\", \"議\", \"ユ\", \"韓\", \"s\", \"ザ\", \"↑\", \"ヘ\", \"6\", \"無\", \"願\", \"蓋\", \"較\", \"繰\", \"詐\", \"罵\", \"u\", \"餓\", \"錯\", \"あ\", \"敵\", \"後\", \"連\", \"頃\", \"遜\", \"飢\", \"げ\", \"つ\", \"ア\", \"W\", \"@\", \"r\", \"確\", \"漁\", \"種\", \"啓\", \"範\", \"─\", \"繍\", \"〆\", \"窪\", \"層\", \"貯\", \"q\", \"脅\", \"懲\", \"フ\", \"捨\", \"釣\", \"゙\", \"た\", \"摯\", \"紀\", \"d\", \"勢\", \"賠\", \"軋\", \"i\", \"む\", \"掛\", \"®\", \"儲\", \"湯\", \"飯\", \"駿\", \"訴\", \"謎\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"餅\", \"納\", \"ア\", \"節\", \"ネ\", \"輿\", \"り\", \"そ\", \"駐\", \"築\", \"線\", \"楊\", \"國\", \"h\", \"漑\", \"貝\", \"ル\", \"謝\", \"詳\", \"ゴ\", \"磯\", \"輝\", \"彌\", \"汚\", \"環\", \"賀\", \"渇\", \"華\", \"頓\", \"フ\", \"ゎ\", \"へ\", \"R\", \"適\", \"ほ\", \"掃\", \"ヶ\", \"跡\", \"ち\", \"極\", \"設\", \"騙\", \"︎\", \"綻\", \"リ\", \"閲\", \"斉\", \"煙\", \"う\", \"澤\", \"々\", \"紡\", \"絨\", \"‐\", \"聞\", \"﨑\", \"m\", \"j\", \"\\u001b\", \"沖\", \"換\", \"襲\", \"語\", \"階\", \"謬\", \"奮\", \"😌\", \"廻\", \"響\", \"鉱\", \"b\", \"獄\", \"窮\", \"偽\", \"黙\", \"紛\", \"綬\", \"★\", \"穀\", \"ホ\", \"縛\", \"評\", \"講\", \"軟\", \"簗\", \"せ\", \"ウ\", \"拶\", \"瞭\", \"ゼ\", \"r\", \"裏\", \"託\", \"顧\", \"塵\", \"殺\", \"U\", \"鈍\", \"驚\", \"W\", \"軌\", \"業\", \"+\", \"陸\", \"ヨ\", \"頒\", \"緊\", \"殲\", \"憑\", \"痩\", \"軍\", \"摂\", \"A\", \"8\", \"Y\", \"幹\", \"ぱ\", \"頬\", \"ず\", \"t\", \"な\", \"尋\", \"賞\", \"k\", \"A\", \"❤\", \"揺\", \"c\", \"l\", \"掻\", \"2\", \"凱\", \" \", \"徹\", \"斬\", \"疇\", \"貞\", \"厭\", \"い\", \"ぶ\", \"購\", \"鍵\", \"B\", \"囁\", \"這\", \"籠\", \"☆\", \"習\", \"練\", \"魚\", \"詞\", \"ふ\", \"$\", \"枠\", \"壇\", \"樺\", \"霧\", \"傑\", \"◎\", \"閑\", \"ヾ\", \"張\", \"諏\", \"←\", \"頭\", \"詩\", \"輔\", \"訣\", \"煩\", \"メ\", \"0\", \"傷\", \"や\", \"愛\", \"賑\", \"園\", \"滲\", \"遙\", \"義\", \"護\", \"偵\", \"釈\", \"進\", \"ミ\", \"ね\", \"ロ\", \"際\", \"興\", \"牽\", \"棲\", \"J\", \"凍\", \"鯖\", \"復\", \"説\", \"β\", \"レ\", \"補\", \"i\", \"曽\", \"買\", \"寧\", \"筆\", \"執\", \"6\", \"薩\", \"楓\", \"w\", \"で\", \"販\", \"ェ\", \"訃\", \"テ\", \"さ\", \"類\", \"維\", \"現\", \"1\", \"ヨ\", \"陰\", \"遼\", \"羅\", \"減\", \"糧\", \"謄\", \"◡\", \"k\", \"ー\", \"3\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/ko": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 1524839,
"_n_tokens": 202771,
"_n_chars": 655190,
"_n_oov_chars": 487535,
"oov_ratio": 0.7441123948778217,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"갈\", \"싱\", \"체\", \"D\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"짠\", \"獻\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"뢰\", \"題\", \"너\", \"♡\", \"😂\", \"별\", \"△\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"專\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"붐\", \"女\", \"*\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"學\", \"툼\", \"F\", \"컸\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"聖\", \"션\", \"히\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"a\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"S\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"©\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"C\", \"문\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"8\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"韓\", \"s\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"國\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"돠\", \"🌵\", \"j\", \"서\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"왘\", \"樺\", \"흄\", \"릅\", \"💣\", \"촬\", \"층\", \"묶\", \"🏻\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"놨\", \"x\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"f\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"푸\", \"結\", \"陳\", \"배\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"峴\", \"챗\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"課\", \"듈\", \"뜸\", \"탐\", \"미\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"Q\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"6\", \"납\", \"後\", \" \", \"므\", \"릉\", \"發\", \"텅\", \"우\", \"켐\", \"펠\", \"랐\", \"습\", \"i\", \"®\", \"강\", \"뛸\", \"색\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"韜\", \"華\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"驚\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"燦\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"L\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"し\", \"류\", \"說\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"す\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"쉬\", \"謝\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"t\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"龍\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"內\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"eson/kplug-base-encoder @ cc100/zh-Hans": {
"tokenizer": "kplug",
"organization": "JD",
"vocab_size": 10261,
"_n_bytes": 2633047,
"_n_tokens": 882451,
"_n_chars": 927311,
"_n_oov_chars": 26378,
"oov_ratio": 0.02844568866324243,
"_oov_charset": "[\"a\", \"©\", \"翕\", \"網\", \"擤\", \"镏\", \"猡\", \"]\", \"據\", \"後\", \"\", \"ㄓ\", \"5\", \"n\", \" \", \"發\", \"N\", \"9\", \"G\", \"à\", \"⒀\", \"號\", \"確\", \"C\", \"門\", \"M\", \"資\", \"D\", \"鼯\", \"浠\", \"屣\", \"Ø\", \"牖\", \"於\", \".\", \"戢\", \"當\", \"浞\", \"X\", \"~\", \"倨\", \"H\", \"慮\", \"噴\", \"損\", \"馕\", \"\", \"員\", \"別\", \"p\", \"韫\", \"ě\", \"t\", \"疴\", \"並\", \"锒\", \"I\", \"鄯\", \"・\", \"-\", \"メ\", \"旆\", \"á\", \"ὐ\", \"V\", \"4\", \"壓\", \"穰\", \"彙\", \"韪\", \"へ\", \"R\", \"個\", \"o\", \"d\", \"ç\", \"⒁\", \"î\", \"犟\", \"ズ\", \"D\", \"\", \"7\", \"\", \"龇\", \"F\", \"C\", \"卻\", \"瑑\", \"�\", \"h\", \"狳\", \"★\", \"標\", \"\", \"時\", \"劑\", \"E\", \"r\", \"動\", \"3\", \"U\", \"為\", \"\\u0000\", \"託\", \"S\", \"運\", \"诨\", \"W\", \"T\", \"權\", \"犰\", \"+\", \"耩\", \"⒂\", \"Y\", \"選\", \"阽\", \"8\", \"亂\", \"5\", \"e\", \"鲎\", \"A\", \"8\", \"啐\", \"K\", \"L\", \"é\", \"\\u0005\", \"溘\", \"&\", \"瑥\", \"イ\", \"A\", \"強\", \"\\b\", \"\", \"⑿\", \"漲\", \"ό\", \"Q\", \"\\u0006\", \"_\", \"報\", \"2\", \" \", \"\", \"阪\", \"ê\", \"逑\", \"\", \"O\", \"▪\", \"T\", \"麽\", \"鸩\", \"V\", \"0\", \"シ\", \"%\", \"旳\", \"電\", \"/\", \"採\", \"の\", \"⒌\", \"瑒\", \"撐\", \"娛\", \"⒃\", \"ù\", \"[\", \"J\", \"藉\", \"瑢\", \"黧\", \"併\", \"i\", \"ソ\", \"價\", \"P\", \"B\", \"瑧\", \"黩\", \"`\", \"內\", \"賣\", \"岣\", \"6\", \""\", \"薩\", \"篢\", \"ノ\", \"1\", \"ヨ\", \"\\u0007\", \"s\", \"灑\", \"ト\", \"瑨\", \"Z\", \"N\", \"讦\"]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/ar": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2813283,
"_n_tokens": 1557671,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/de": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1814876,
"_n_tokens": 683401,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/en": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1124813,
"_n_tokens": 257070,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/es": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1664455,
"_n_tokens": 568539,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/fa": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2054052,
"_n_tokens": 1285426,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/fr": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1540504,
"_n_tokens": 515669,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/ja": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1774770,
"_n_tokens": 600011,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/ko": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 1524839,
"_n_tokens": 1305249,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"fnlp/moss-moon-003-sft @ cc100/zh-Hans": {
"tokenizer": "moss-moon-003-sft",
"organization": "Fudan",
"vocab_size": 106072,
"_n_bytes": 2633047,
"_n_tokens": 557455,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/ar": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2813283,
"_n_tokens": 1212449,
"_n_chars": 1560987,
"_n_oov_chars": 24459,
"oov_ratio": 0.015668932540757866,
"_oov_charset": "[\"م\", \"u\", \" \", \"۲\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"9\", \"ب\", \"\", \"ط\", \"ق\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"ۤ\", \"د\", \"۰\", \"٨\", \"▫\", \"i\", \"\", \"٦\", \"
\", \"ْ\", \"ٌ\", \"😊\", \"ج\", \"█\", \"‹\", \"\", \"ن\", \"7\", \"⤴\", \"ۚ\", \"ة\", \"ا\", \"ھ\", \"٪\", \"ئ\", \"ۗ\", \"ۖ\", \"َ\", \"ي\", \"آ\", \"٩\", \"\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"ح\", \"ت\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"١\", \"و\", \"8\", \"5\", \"L\", \"\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"B\", \"ل\", \"ء\", \"1\", \"ّ\", \"ص\", \"ث\", \"n\", \"4\", \"6\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/de": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1814876,
"_n_tokens": 711022,
"_n_chars": 1784021,
"_n_oov_chars": 530,
"oov_ratio": 0.0002970817047557176,
"_oov_charset": "[\"u\", \"↩\", \"f\", \"U\", \"😂\", \"h\", \"\", \"‹\", \"➔\", \"\", \"S\", \" \", \"N\", \"T\", \"▼\", \"G\", \"☺\", \"¼\", \"😃\", \"M\", \"\", \"\", \"g\", \"¤\", \"D\", \"K\", \"😈\", \"L\", \"t\", \"œ\", \"R\", \"k\", \"\", \"❤\", \"😀\", \"Ã\", \"›\", \"😦\", \"🙄\", \"‽\", \"l\", \"😉\", \"w\", \"s\", \"🙁\", \"😆\", \"\", \"Ÿ\", \"F\", \"ß\", \"™\", \"\", \"b\", \"�\", \"😢\", \"̈\", \"🙂\", \"♡\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/en": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1124813,
"_n_tokens": 268022,
"_n_chars": 1121360,
"_n_oov_chars": 43,
"oov_ratio": 3.8346293786116855e-05,
"_oov_charset": "[\"\", \"⑤\", \"⑩\", \"⑦\", \"\", \"③\", \"😉\", \"\", \"�\", \"\", \"⑧\", \"¦\", \"😥\", \"\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/es": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1664455,
"_n_tokens": 610231,
"_n_chars": 1630297,
"_n_oov_chars": 68,
"oov_ratio": 4.171019145591263e-05,
"_oov_charset": "[\"✓\", \"\", \"️\", \"▷\", \"\", \"❤\", \"😀\", \"\", \"😦\", \"😉\", \"🙁\", \"👍\", \"\", \"✪\", \"✔\", \"\", \"👏\", \"🙂\", \"✖\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/fa": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2054052,
"_n_tokens": 883078,
"_n_chars": 1145876,
"_n_oov_chars": 15476,
"oov_ratio": 0.01350582436494001,
"_oov_charset": "[\"م\", \" \", \"۲\", \"ض\", \"G\", \"9\", \"ب\", \"\", \"ط\", \"ق\", \"إ\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"i\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"۳\", \"ט\", \"️\", \"\", \"♥\", \"ن\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"8\", \"5\", \"A\", \"t\", \"k\", \"\", \"❤\", \"ڪ\", \"c\", \"›\", \"؛\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"ـ\", \"ٍ\", \"ش\", \"۷\", \"س\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"4\", \"6\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/fr": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1540504,
"_n_tokens": 563220,
"_n_chars": 1484970,
"_n_oov_chars": 57,
"oov_ratio": 3.8384613830582436e-05,
"_oov_charset": "[\"f\", \"T\", \"̧\", \"℃\", \"\", \"😀\", \"❤\", \"😉\", \"Ê\", \"🤔\", \"H\", \"♕\", \"\", \"Ô\", \"F\", \"C\", \"
\", \"™\", \"�\", \"̂\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/ja": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1774770,
"_n_tokens": 390483,
"_n_chars": 603065,
"_n_oov_chars": 340147,
"oov_ratio": 0.5640304113155299,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"G\", \"又\", \"族\", \"C\", \"多\", \"婆\", \"D\", \"ラ\", \"ぃ\", \"✨\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \".\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"示\", \"服\", \"腎\", \"皿\", \"態\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"代\", \"箭\", \"喜\", \"g\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"紹\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"布\", \"杏\", \"歓\", \"撮\", \"網\", \"間\", \"郷\", \"タ\", \"閉\", \"教\", \"有\", \"八\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"貧\", \"余\", \"派\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"忠\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"→\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"宣\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"場\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"崎\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"的\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"靴\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"滝\", \"橋\", \"問\", \"旦\", \"副\", \"1\", \"核\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"v\", \"艦\", \"麓\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"秀\", \"完\", \"限\", \"学\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"地\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"行\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"鈴\", \"憤\", \"プ\", \"讐\", \"F\", \"令\", \"嫁\", \"頷\", \"盤\", \"術\", \"治\", \"純\", \"薙\", \"遠\", \"標\", \"算\", \"民\", \"店\", \"則\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"K\", \"曲\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"ヒ\", \"傘\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"耳\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"p\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"介\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"?\", \"詐\", \"u\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"r\", \"索\", \"戦\", \"啓\", \"垠\", \"窪\", \"〆\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"楊\", \"匡\", \"h\", \"浄\", \"止\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"ヶ\", \"設\", \"幕\", \"不\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"秋\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"W\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"c\", \"l\", \"凱\", \"疇\", \"帝\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"J\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"e\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"庁\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"エ\", \"著\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"a\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"I\", \"潟\", \"壊\", \"m\", \"勝\", \"恒\", \"傾\", \"巨\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"健\", \"銃\", \"閣\", \"衷\", \"点\", \"S\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"岡\", \"´\", \"鋲\", \"永\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"男\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"朝\", \"支\", \"乏\", \"佇\", \"攻\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"4\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"志\", \"勘\", \"兎\", \"葉\", \"爾\", \"ㅂ\", \"を\", \"還\", \"ム\", \"規\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"汗\", \"黄\", \"春\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"四\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"U\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"委\", \"誰\", \"覆\", \"o\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"我\", \"ス\", \"樹\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"伊\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"ハ\", \"蛇\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"家\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"茨\", \"N\", \"途\", \"纏\", \"他\", \"お\", \"云\", \"農\", \"N\", \"阿\", \"貴\", \"赦\", \"要\", \"弁\", \"貸\", \"雄\", \"脇\", \"矢\", \"任\", \"ぴ\", \"愕\", \"漫\", \"\", \"拷\", \"飾\", \"慮\", \"糖\", \"貌\", \"郵\", \"鎖\", \"カ\", \"法\", \"該\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"幸\", \"ゆ\", \"写\", \"博\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"C\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"唇\", \"伏\", \"姥\", \"営\", \"E\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"8\", \"革\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"千\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"清\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"q\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"d\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"〈\", \"唱\", \"再\", \"桁\", \"😭\", \"Ⅶ\", \"ア\", \"会\", \"数\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"掃\", \"極\", \"胚\", \"発\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"j\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"被\", \"外\", \"痴\", \"塵\", \"U\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"A\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"品\", \"練\", \"詞\", \"ふ\", \"〉\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"坂\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"成\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"3\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"ァ\", \"針\", \"資\", \"沢\", \"丁\", \"腫\", \"激\", \"x\", \"須\", \"泥\", \"立\", \"臆\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"五\", \"引\", \"暦\", \"来\", \"栽\", \"ズ\", \"蒙\", \"倍\", \"之\", \"球\", \"瓦\", \"舞\", \"歪\", \"堂\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"空\", \"呂\", \"斧\", \"才\", \"f\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"洒\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"香\", \"侵\", \"客\", \"移\", \"結\", \"陳\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"O\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"信\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"夏\", \"助\", \"丼\", \"ダ\", \"区\", \"n\", \"賛\", \"背\", \"預\", \"顔\", \"工\", \"朗\", \"炉\", \"賭\", \"蠍\", \"9\", \"M\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"y\", \"倫\", \"稀\", \"散\", \"H\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"ケ\", \"略\", \"森\", \"課\", \"呆\", \"料\", \"悶\", \"先\", \"浴\", \"恰\", \"墜\", \"7\", \"纒\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"ゥ\", \"哀\", \"尽\", \"出\", \"劉\", \"合\", \"ま\", \"割\", \"且\", \"状\", \"政\", \"仲\", \"沸\", \"∇\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"腔\", \"末\", \"電\", \"煮\", \"採\", \"重\", \"施\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"P\", \"B\", \"^\", \"遥\", \"税\", \"句\", \"睦\", \"丘\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"名\", \"懸\", \"提\", \"昇\", \"久\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"宇\", \"策\", \"ノ\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"低\", \"相\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"都\", \"奈\", \"じ\", \"捏\", \"漏\", \"烈\", \"古\", \"■\", \"磨\", \"弥\", \"忙\", \"⇒\", \"應\", \"桑\", \"摩\", \"慈\", \"崔\", \"挫\", \"英\", \"勉\", \"ワ\", \"↓\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"z\", \"幣\", \"見\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"Q\", \"報\", \"況\", \"J\", \"s\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"2\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"街\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"火\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"指\", \"能\", \"6\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"後\", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"署\", \"摘\", \"─\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"i\", \"循\", \"®\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"御\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"貝\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"菊\", \"頓\", \"華\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"比\", \"b\", \"窒\", \"至\", \"綬\", \"鼓\", \"亭\", \"揉\", \"ホ\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"軍\", \"内\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"也\", \"狩\", \"歌\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"前\", \"詩\", \"0\", \"傷\", \"曹\", \"や\", \"箇\", \"園\", \"瞑\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"保\", \"執\", \"楓\", \"w\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"槃\", \"射\", \"嶽\", \"允\", \"綜\", \"瀬\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"宗\", \"に\", \"鹿\", \"豪\", \"捕\", \"X\", \"逆\", \"吹\", \"寺\", \"絞\", \"騰\", \"礁\", \"甚\", \"婚\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"−\", \"澪\", \"筋\", \"情\", \"典\", \"良\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"氷\", \"次\", \"ガ\", \"[\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"Z\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"定\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"分\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"風\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"元\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"篤\", \"逸\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"T\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"5\", \"編\", \"郭\", \"腹\", \"L\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"章\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"贅\", \"随\", \"捺\", \"ト\", \"加\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"漢\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"ャ\", \"娠\", \"烙\", \"Y\", \"鞄\", \"締\", \"昭\", \"e\", \"最\", \"簡\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \"V\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"手\", \"〟\", \"世\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"啜\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"叫\", \"株\", \"丸\", \"蝶\", \"俳\", \"荘\", \"条\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"面\", \"主\", \"R\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"m\", \"措\", \"語\", \"謬\", \"洩\", \"獄\", \"黙\", \"里\", \"厚\", \"★\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"ウ\", \"用\", \"拶\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"仮\", \"頬\", \"邸\", \"目\", \"瑞\", \"」\", \"t\", \"尋\", \"尺\", \"果\", \"k\", \"景\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"張\", \"在\", \"煩\", \"榴\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"販\", \"訃\", \"裂\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/ko": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 1524839,
"_n_tokens": 202828,
"_n_chars": 655190,
"_n_oov_chars": 472711,
"oov_ratio": 0.7214868969306614,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"族\", \"갈\", \"싱\", \"체\", \"多\", \"D\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"德\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"罰\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"代\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"有\", \"八\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"的\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"1\", \"숏\", \"福\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"地\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"行\", \"벽\", \"甲\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"F\", \"컸\", \"治\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"民\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"不\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"秋\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"帝\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"a\", \"孝\", \"敬\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"S\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"永\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"男\", \"朝\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"志\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"春\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"家\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"途\", \"戊\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"雄\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"法\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"C\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"8\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"〈\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"j\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"被\", \"外\", \"얄\", \"앰\", \"림\", \"蚩\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"〉\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"씹\", \"資\", \"논\", \"빤\", \"놨\", \"x\", \"됬\", \"立\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"五\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"之\", \"원\", \"갱\", \"레\", \"堂\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"f\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"푸\", \"客\", \"結\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"信\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"哀\", \"획\", \"뭉\", \"出\", \"젝\", \"合\", \"쩌\", \"탓\", \"페\", \"政\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"相\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"古\", \"■\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"생\", \"♥\", \"대\", \"융\", \"摩\", \"묵\", \"英\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"Q\", \"劫\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"火\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"6\", \"常\", \"납\", \"後\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"i\", \"侯\", \"강\", \"뛸\", \"색\", \"御\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"好\", \"韜\", \"華\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"比\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"宗\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"分\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"L\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"章\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"昭\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"手\", \"껑\", \"땡\", \"돼\", \"世\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"面\", \"R\", \"主\", \"웠\", \"適\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"里\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"目\", \"t\", \"」\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"는\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google-bert/bert-base-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-cased",
"organization": "Google",
"vocab_size": 28996,
"_n_bytes": 2633047,
"_n_tokens": 879709,
"_n_chars": 927311,
"_n_oov_chars": 690347,
"oov_ratio": 0.7444611354766631,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"又\", \"鱼\", \"族\", \"⒀\", \"C\", \"撬\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \".\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"狸\", \"页\", \"挈\", \"吆\", \"\", \"贵\", \"噌\", \"德\", \"贱\", \"杆\", \"浙\", \"汐\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"示\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"代\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"有\", \"八\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"忠\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"氰\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"宣\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"近\", \"培\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"崎\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"的\", \"杭\", \"【\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"偿\", \"衬\", \"撐\", \"靴\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"1\", \"笃\", \"核\", \"找\", \"闻\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"麓\", \"栖\", \"瞠\", \"葆\", \"潭\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"秀\", \"陵\", \"戳\", \"完\", \"戾\", \"限\", \"学\", \"冯\", \"睐\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"地\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"~\", \"陈\", \"裙\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"行\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"锥\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \"令\", \"嫁\", \"治\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"民\", \"店\", \"嫂\", \"书\", \"跃\", \"耙\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"痊\", \"曲\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"耳\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"介\", \"骰\", \"捧\", \"体\", \"?\", \"疼\", \"邻\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"梦\", \"沾\", \"增\", \"渠\", \"饰\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"止\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"冰\", \"蜴\", \"甜\", \"炙\", \"幕\", \"不\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"秋\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"蟀\", \"馍\", \"咐\", \"帝\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"锅\", \"勃\", \"样\", \"卷\", \"幅\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"瘀\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"廉\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"乒\", \"莘\", \"螃\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"健\", \"嗨\", \"D\", \"衷\", \"点\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"永\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"苛\", \"刊\", \"佘\", \"础\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"男\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"朝\", \"读\", \"蹒\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"4\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"志\", \"较\", \"笛\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"嘤\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"骸\", \"严\", \"春\", \"睑\", \"骏\", \"颉\", \"与\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"莓\", \"偶\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"四\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"我\", \"煎\", \"颖\", \"九\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"伊\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"家\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"阿\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"呦\", \"估\", \"值\", \"雄\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"厮\", \"枉\", \"纷\", \"法\", \"婶\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"幸\", \"写\", \"博\", \"补\", \"夕\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"绽\", \"辈\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"8\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"娄\", \"预\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"千\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"瀚\", \"矶\", \"璃\", \"利\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"清\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"涕\", \"葩\", \"掠\", \"靛\", \"付\", \"豚\", \"为\", \"昊\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"〈\", \"摞\", \"霸\", \"唱\", \"再\", \"蟋\", \"郴\", \"徇\", \"异\", \"会\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"へ\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"阜\", \"列\", \"珊\", \"麾\", \"被\", \"稍\", \"外\", \"痴\", \"阂\", \"裔\", \"胀\", \"论\", \"首\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"纹\", \"洗\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"品\", \"〉\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"坂\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"成\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"蹴\", \"3\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"激\", \"臆\", \"泥\", \"立\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"五\", \"引\", \"袍\", \"来\", \"锤\", \"畑\", \"讪\", \"忿\", \"疵\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"之\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"堂\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"空\", \"赞\", \"動\", \"才\", \"斧\", \"翅\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"洒\", \"绞\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"香\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"龚\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"信\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"夏\", \"助\", \"扣\", \"锂\", \"区\", \"捂\", \"芬\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"梵\", \"9\", \"攸\", \"岑\", \"涉\", \"晰\", \"刚\", \"蝉\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"篷\", \"硕\", \"玉\", \"漠\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"哒\", \"伫\", \"畜\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"森\", \"柳\", \"料\", \"虽\", \"先\", \"呆\", \"浴\", \"俨\", \"鄯\", \"恰\", \"镉\", \"欢\", \"殉\", \"办\", \"臂\", \"惟\", \"7\", \"扼\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"遂\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"出\", \"合\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"政\", \"状\", \"仲\", \"沸\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"偎\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"施\", \"载\", \"炸\", \"匾\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"税\", \"莴\", \"遥\", \"犀\", \"價\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"名\", \"肃\", \"舆\", \"谬\", \"提\", \"军\", \"撞\", \"久\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"宇\", \"策\", \"瑨\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"帜\", \"弈\", \"低\", \"动\", \"奸\", \"相\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"都\", \"泛\", \"奈\", \"喧\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"古\", \"广\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"弘\", \"挫\", \"饷\", \"英\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"后\", \"蠢\", \"锐\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"2\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"街\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"火\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"指\", \"能\", \"沧\", \"6\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \"後\", \"檀\", \"血\", \" \", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"必\", \"均\", \"无\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"踱\", \"峨\", \"茄\", \"仕\", \"庄\", \"急\", \"浆\", \"舶\", \"桓\", \"进\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"御\", \"辩\", \"朔\", \"柠\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"疹\", \"评\", \"好\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"择\", \"勇\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"战\", \"岁\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"比\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"亭\", \"鼓\", \"舰\", \"诫\", \"伉\", \"揉\", \"曾\", \"旷\", \"茂\", \"皙\", \"\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"内\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"也\", \"蚀\", \"狩\", \"歌\", \"啪\", \"聂\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"前\", \"唉\", \"0\", \"剔\", \"曹\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"保\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"固\", \"玄\", \"禾\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"宗\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"咖\", \"薯\", \"逆\", \"传\", \"吹\", \"寺\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"莫\", \"婚\", \"鹑\", \"迭\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"良\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"定\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"分\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"元\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"迩\", \"印\", \"○\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"5\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"腹\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"▪\", \"憋\", \"阎\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"章\", \"奥\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"奖\", \"加\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"雳\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"绰\", \"苏\", \"e\", \"昭\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"手\", \"溉\", \"摹\", \"拆\", \"瞪\", \"世\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"啜\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"邂\", \"膜\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"镇\", \"峻\", \"眯\", \"晨\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"面\", \"主\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"里\", \"搜\", \"芙\", \"厚\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"邸\", \"膳\", \"对\", \"目\", \"瑞\", \"测\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"擂\", \"何\", \"遮\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"马\", \"裂\", \"瀛\", \"皑\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/ar": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2813283,
"_n_tokens": 516389,
"_n_chars": 1560987,
"_n_oov_chars": 429523,
"oov_ratio": 0.27516116405838104,
"_oov_charset": "[\"م\", \"u\", \" \", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"G\", \"9\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"q\", \"x\", \"ذ\", \"😀\", \"خ\", \"“\", \"×\", \"د\", \"ۤ\", \"۰\", \"d\", \"y\", \"٨\", \"X\", \"τ\", \"▫\", \"i\", \"®\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"’\", \"a\", \"ٌ\", \"😊\", \"ج\", \"I\", \"h\", \"¡\", \"m\", \"\", \"…\", \"ن\", \"χ\", \"7\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"”\", \"ئ\", \"٪\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"آ\", \"٩\", \"j\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ٰ\", \"ظ\", \"½\", \"﴾\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"f\", \"U\", \"μ\", \"—\", \"v\", \"S\", \"α\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"–\", \"k\", \"\", \"Х\", \"﴿\", \"c\", \"؛\", \"Q\", \"٠\", \"l\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"V\", \"٧\", \"۷\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"g\", \"J\", \"٤\", \"B\", \"P\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"ä\", \"ص\", \"ّ\", \"ث\", \"n\", \"η\", \"4\", \"Z\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/de": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1814876,
"_n_tokens": 541246,
"_n_chars": 1784021,
"_n_oov_chars": 168627,
"oov_ratio": 0.09452074835441959,
"_oov_charset": "[\"u\", \"¶\", \"İ\", \" \", \"ς\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"9\", \"à\", \"ć\", \"r\", \"e\", \"¼\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"q\", \"x\", \"Ø\", \"😀\", \"‚\", \"“\", \"😦\", \"y\", \"d\", \"τ\", \"X\", \"û\", \"i\", \"H\", \"°\", \"å\", \"’\", \"a\", \"ó\", \"€\", \"I\", \"h\", \"\", \"č\", \"m\", \"á\", \"…\", \"7\", \"â\", \"”\", \"R\", \"œ\", \"ç\", \"ε\", \"Ã\", \"ρ\", \"😉\", \"ï\", \"‐\", \"j\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"¹\", \"ú\", \"\", \"b\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"̈\", \"🙂\", \"E\", \"😂\", \"↩\", \"f\", \"U\", \"—\", \"É\", \"S\", \"α\", \"ι\", \"W\", \"T\", \"ö\", \"Y\", \"8\", \"5\", \"A\", \"¬\", \"z\", \"😈\", \"K\", \"L\", \"é\", \"t\", \"o\", \"k\", \"–\", \"ė\", \"c\", \"🙄\", \"Q\", \"Ö\", \"l\", \"ü\", \"s\", \"😆\", \"\", \"ø\", \"‘\", \"2\", \"ß\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"0\", \"²\", \"g\", \"¤\", \"J\", \"\", \"š\", \"P\", \"B\", \"`\", \"p\", \"Ü\", \"‽\", \"w\", \"ư\", \"🙁\", \"1\", \"ä\", \"n\", \"Z\", \"6\", \"4\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/en": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1124813,
"_n_tokens": 357068,
"_n_chars": 1121360,
"_n_oov_chars": 40103,
"oov_ratio": 0.0357628237140615,
"_oov_charset": "[\"u\", \" \", \"¦\", \"N\", \"G\", \"r\", \"e\", \"M\", \"è\", \"D\", \"q\", \"x\", \"“\", \"d\", \"y\", \"X\", \"i\", \"H\", \"’\", \"a\", \"ó\", \"I\", \"h\", \"¡\", \"m\", \"\", \"…\", \"7\", \"”\", \"‑\", \"R\", \"😉\", \"ï\", \"j\", \"F\", \"C\", \"ñ\", \"\", \"\", \"b\", \"�\", \"\", \"🙂\", \"E\", \"f\", \"U\", \"—\", \"S\", \"W\", \"T\", \"Y\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"k\", \"–\", \"c\", \"Q\", \"l\", \"s\", \"😥\", \"\", \"‘\", \"2\", \"´\", \"O\", \"V\", \"0\", \"g\", \"J\", \"B\", \"P\", \"p\", \"w\", \"1\", \"n\", \"Z\", \"6\", \"4\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/es": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1664455,
"_n_tokens": 589419,
"_n_chars": 1630297,
"_n_oov_chars": 87363,
"oov_ratio": 0.053587168472983754,
"_oov_charset": "[\"u\", \" \", \"¿\", \"N\", \"G\", \"à\", \"9\", \"r\", \"e\", \"M\", \"è\", \"D\", \"q\", \"x\", \"😀\", \"Í\", \"“\", \"😦\", \"y\", \"d\", \"ò\", \"X\", \"i\", \"º\", \"®\", \"H\", \"ª\", \"°\", \"Ñ\", \"\", \"👏\", \"’\", \"a\", \"ó\", \"h\", \"I\", \"¡\", \"ý\", \"m\", \"á\", \"️\", \"…\", \"í\", \"7\", \"”\", \"R\", \"▷\", \"😉\", \"j\", \"\", \"ñ\", \"C\", \"F\", \"ú\", \"b\", \"Ú\", \"🙂\", \"E\", \"✓\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"ö\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"–\", \"k\", \"❤\", \"\", \"c\", \"Q\", \"l\", \"ü\", \"s\", \"ø\", \"‘\", \"2\", \"´\", \"ô\", \"O\", \"Ó\", \"М\", \"V\", \"Á\", \"\", \"0\", \"g\", \"J\", \"\", \"P\", \"B\", \"p\", \"w\", \"🙁\", \"1\", \"―\", \"n\", \"Z\", \"4\", \"6\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/fa": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2054052,
"_n_tokens": 376414,
"_n_chars": 1145876,
"_n_oov_chars": 362839,
"oov_ratio": 0.31664770010018534,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"N\", \"G\", \"9\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"q\", \"x\", \"ذ\", \"خ\", \"“\", \"×\", \"د\", \"۰\", \"y\", \"d\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"’\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"h\", \"I\", \"m\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"”\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"j\", \"ۆ\", \"F\", \"C\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"f\", \"U\", \"v\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"t\", \"o\", \"k\", \"\", \"–\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"٫\", \"ـ\", \"O\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"g\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"w\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"4\", \"6\", \"Z\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/fr": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1540504,
"_n_tokens": 533134,
"_n_chars": 1484970,
"_n_oov_chars": 89357,
"oov_ratio": 0.0601742796150764,
"_oov_charset": "[\"u\", \" \", \"N\", \"Â\", \"G\", \"à\", \"9\", \"r\", \"e\", \"è\", \"M\", \"À\", \"D\", \"q\", \"x\", \"😀\", \"“\", \"y\", \"d\", \"ã\", \"Ê\", \"X\", \"û\", \"i\", \"®\", \"H\", \"°\", \"Ô\", \"’\", \"Ç\", \"a\", \"h\", \"I\", \"m\", \"…\", \"í\", \"7\", \"â\", \"ğ\", \"”\", \"R\", \"œ\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"j\", \"♕\", \"\", \"F\", \"C\", \"™\", \"b\", \"�\", \"̂\", \"🙂\", \"E\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"Y\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"́\", \"é\", \"t\", \"o\", \"k\", \"–\", \"c\", \"Q\", \"l\", \"ü\", \"s\", \"🤔\", \"ê\", \"2\", \"‘\", \"´\", \"ô\", \"O\", \"V\", \"0\", \"Î\", \"ù\", \"g\", \"̧\", \"J\", \"\", \"P\", \"B\", \"p\", \"w\", \"1\", \"
\", \"ä\", \"È\", \"―\", \"n\", \"Z\", \"6\", \"4\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/ja": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1774770,
"_n_tokens": 376831,
"_n_chars": 603065,
"_n_oov_chars": 154683,
"oov_ratio": 0.2564947393730361,
"_oov_charset": "[\"ー\", \"③\", \"蛍\", \"ペ\", \"サ\", \"9\", \"G\", \"セ\", \"f\", \"C\", \"e\", \"め\", \"ァ\", \"∀\", \"D\", \"ラ\", \"ぃ\", \"ベ\", \"✨\", \"x\", \"ハ\", \"よ\", \"に\", \"疎\", \"ヲ\", \"X\", \"妬\", \"I\", \"エ\", \"鉢\", \"欝\", \"K\", \"’\", \"ぅ\", \"a\", \"R\", \"喩\", \"ク\", \"ィ\", \"I\", \"筈\", \"m\", \"オ\", \"讃\", \"て\", \"…\", \"−\", \"¥\", \"澪\", \"🌙\", \"ょ\", \"d\", \"暦\", \"G\", \"ズ\", \"F\", \"謳\", \"暁\", \"ロ\", \"②\", \"犠\", \"ぉ\", \"f\", \"ド\", \"゚\", \"—\", \"藁\", \"S\", \"轢\", \"穏\", \"و\", \"桟\", \"ヵ\", \"韮\", \"イ\", \"べ\", \"ヘ\", \"コ\", \"渓\", \"ど\", \"猟\", \"´\", \"ぽ\", \"鋲\", \"瘻\", \"O\", \"ゲ\", \"る\", \"ニ\", \"0\", \"キ\", \"マ\", \"ご\", \"ュ\", \"の\", \"パ\", \"g\", \"S\", \"゚\", \"ガ\", \"勲\", \"ぬ\", \"b\", \"X\", \"`\", \"躾\", \"騒\", \"っ\", \"ダ\", \"―\", \"♪\", \"n\", \"✧\", \"Z\", \"賛\", \"4\", \"袴\", \"兎\", \"タ\", \"9\", \"彡\", \"ㅂ\", \"を\", \"M\", \"ナ\", \"ぞ\", \"ム\", \"酔\", \"M\", \"y\", \"H\", \"辿\", \"く\", \"ゃ\", \"錬\", \"ジ\", \"粋\", \"レ\", \"ケ\", \"が\", \"戯\", \"▼\", \"4\", \"→\", \"Z\", \"7\", \"纒\", \"ゾ\", \"艸\", \"は\", \"呟\", \"ぼ\", \"か\", \"▷\", \"殻\", \"ボ\", \"罠\", \"D\", \"\", \"え\", \"ゥ\", \"ビ\", \"7\", \"逡\", \"ま\", \"謡\", \"娯\", \"h\", \"�\", \"◇\", \"呑\", \"∇\", \"P\", \"=\", \"み\", \"♡\", \"ポ\", \"U\", \"遡\", \"挿\", \"ブ\", \"T\", \"○\", \"⇔\", \"5\", \"ギ\", \"L\", \"́\", \"ン\", \"o\", \"缶\", \"–\", \"⻑\", \"\\b\", \"き\", \"ぐ\", \"砕\", \"💦\", \"れ\", \"ヴ\", \"モ\", \"づ\", \"ス\", \"テ\", \"ヤ\", \"ゥ\", \"バ\", \"😢\", \"゙\", \"砦\", \"鋭\", \"●\", \"T\", \"艶\", \"ハ\", \"梱\", \"w\", \"俵\", \"ピ\", \"惣\", \"カ\", \"詈\", \"ひ\", \"`\", \"捜\", \"も\", \"ソ\", \"ぇ\", \"B\", \"P\", \"^\", \"巣\", \"Д\", \"デ\", \"1\", \"ノ\", \"ぁ\", \"ト\", \"ノ\", \"ろ\", \"ウ\", \"ば\", \"v\", \"ぎ\", \"N\", \"y\", \"醤\", \"お\", \"5\", \"ら\", \"懐\", \"N\", \"饉\", \"L\", \"び\", \"陥\", \"Q\", \"×\", \"ぴ\", \"奨\", \"し\", \"\", \"縦\", \"~\", \"繊\", \"ゞ\", \"け\", \"髭\", \"じ\", \"カ\", \"顕\", \"■\", \"と\", \"醸\", \"匂\", \"😊\", \"⇒\", \"メ\", \"V\", \"ヌ\", \"蝋\", \"ゆ\", \"⑪\", \"”\", \"ワ\", \"↓\", \"こ\", \"▽\", \"コ\", \"◯\", \"プ\", \"讐\", \"ざ\", \"F\", \"C\", \"壌\", \"O\", \"E\", \"Ⅹ\", \"贔\", \"鶏\", \"ョ\", \"ぷ\", \"̈\", \"E\", \"3\", \"ッ\", \"す\", \"H\", \"噛\", \"峠\", \"ャ\", \"Y\", \"ぜ\", \"8\", \"鞄\", \"捗\", \"z\", \"K\", \"‼\", \"ゅ\", \"ツ\", \"㎞\", \"Q\", \"舘\", \"J\", \"s\", \"ヽ\", \"縞\", \"\", \"だ\", \"拠\", \"2\", \"̀\", \"ヒ\", \"麹\", \"飴\", \"グ\", \"V\", \"シ\", \"ィ\", \"拝\", \"贋\", \"噂\", \"屓\", \"リ\", \"〟\", \"わ\", \"ん\", \"p\", \"覗\", \"剰\", \"ォ\", \"渕\", \"チ\", \"ユ\", \"ザ\", \"ヘ\", \"6\", \"繰\", \"u\", \"あ\", \" \", \"げ\", \"つ\", \"ア\", \"W\", \"r\", \"─\", \"繍\", \"〆\", \"q\", \"フ\", \"“\", \"゙\", \"た\", \"d\", \"i\", \"む\", \"®\", \"Ⅱ\", \"😭\", \"Ⅶ\", \"ア\", \"ネ\", \"そ\", \"り\", \"h\", \"漑\", \"ル\", \"ゴ\", \"汚\", \"渇\", \"フ\", \"ゎ\", \"へ\", \"R\", \"ほ\", \"ヶ\", \"ち\", \"︎\", \"リ\", \"斉\", \"う\", \"々\", \"‐\", \"\\u001b\", \"﨑\", \"m\", \"j\", \"😌\", \"廻\", \"b\", \"鉱\", \"黙\", \"★\", \"ホ\", \"簗\", \"せ\", \"ウ\", \"拶\", \"μ\", \"ゼ\", \"U\", \"W\", \"+\", \"ヨ\", \"痩\", \"摂\", \"A\", \"8\", \"Y\", \"ぱ\", \"頬\", \"ず\", \"t\", \"な\", \"k\", \"A\", \"❤\", \"揺\", \"c\", \"l\", \"掻\", \"2\", \" \", \"い\", \"ぶ\", \"B\", \"囁\", \"☆\", \"ふ\", \"$\", \"枠\", \"ヾ\", \"メ\", \"0\", \"や\", \"釈\", \"ミ\", \"ね\", \"ロ\", \"J\", \"β\", \"レ\", \"i\", \"曽\", \"6\", \"w\", \"で\", \"ェ\", \"訃\", \"テ\", \"さ\", \"1\", \"ヨ\", \"◡\", \"k\", \"ー\", \"3\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/ko": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 1524839,
"_n_tokens": 199752,
"_n_chars": 655190,
"_n_oov_chars": 512195,
"oov_ratio": 0.7817503319647736,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"갈\", \"싱\", \"체\", \"D\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"👏\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"짠\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"쫒\", \"◈\", \"촉\", \"욥\", \"텀\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"뢰\", \"♡\", \"너\", \"😂\", \"별\", \"△\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"붐\", \"女\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"툼\", \"F\", \"컸\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"른\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"➊\", \"훅\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"h\", \"낮\", \"왓\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"⬇\", \"멕\", \"↕\", \"않\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"♤\", \"←\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"ㅙ\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"맬\", \"🦅\", \"쪄\", \"션\", \"히\", \"벚\", \"’\", \"즙\", \"뺀\", \"쳤\", \"a\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"S\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"급\", \"누\", \"밟\", \"셰\", \"맷\", \"💥\", \"N\", \"렷\", \"렘\", \"령\", \"트\", \"悧\", \"💰\", \"윗\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"즈\", \"킥\", \"C\", \"문\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"8\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"s\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"짤\", \"섯\", \"핸\", \"q\", \"펌\", \"팥\", \"압\", \"언\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"볍\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"훨\", \"걸\", \"돠\", \"🌵\", \"j\", \"서\", \"숭\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"흄\", \"릅\", \"💣\", \"촬\", \"층\", \"묶\", \"🏻\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"냉\", \"힙\", \"팽\", \"헝\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"x\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"넌\", \"임\", \"ㅔ\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"몸\", \"f\", \"쥬\", \"—\", \"둔\", \"ㄱ\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"톨\", \"냈\", \"푸\", \"배\", \"앤\", \"재\", \"책\", \"‘\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"챗\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"듈\", \"뜸\", \"탐\", \"미\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"🙌\", \"B\", \"P\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"렴\", \"생\", \"♥\", \"대\", \"융\", \"묵\", \"”\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"족\", \"닥\", \"힜\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"곱\", \"난\", \"Q\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"≪\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"꿕\", \"6\", \"납\", \" \", \"므\", \"릉\", \"텅\", \"우\", \"켐\", \"펠\", \"“\", \"랐\", \"습\", \"i\", \"®\", \"강\", \"뛸\", \"색\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"숫\", \"죤\", \"툭\", \"흠\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"ᴀ\", \"놔\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"👨\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"웬\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"짊\", \"㏊\", \"젊\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"L\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"게\", \"탬\", \"숨\", \"축\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"류\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"았\", \"↑\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"🏫\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"삼\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"t\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"龍\", \"팍\", \"곁\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"飮\", \"마\", \"탁\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google-bert/bert-base-chinese @ cc100/zh-Hans": {
"tokenizer": "bert-base-chinese",
"organization": "Google",
"vocab_size": 21128,
"_n_bytes": 2633047,
"_n_tokens": 876599,
"_n_chars": 927311,
"_n_oov_chars": 42361,
"oov_ratio": 0.04568154588913536,
"_oov_charset": "[\"a\", \"u\", \"翕\", \"擤\", \"镏\", \"ς\", \"猡\", \"ㄓ\", \"\", \" \", \"N\", \"G\", \"9\", \"à\", \"r\", \"⒀\", \"e\", \"C\", \"M\", \"D\", \"鼯\", \"x\", \"q\", \"浠\", \"屣\", \"Ø\", \"牖\", \"“\", \"×\", \"戢\", \"y\", \"d\", \"浞\", \"τ\", \"X\", \"i\", \"倨\", \"H\", \"馕\", \"\", \"’\", \"韫\", \"ě\", \"t\", \"a\", \"疴\", \"锒\", \"h\", \"I\", \"鄯\", \"m\", \"旆\", \"á\", \"ὐ\", \"V\", \"…\", \"7\", \"穰\", \"韪\", \"”\", \"R\", \"d\", \"ç\", \"⒁\", \"î\", \"犟\", \"ズ\", \"D\", \"\", \"\", \"j\", \"龇\", \"F\", \"C\", \"b\", \"�\", \"瑑\", \"h\", \"狳\", \"\", \"E\", \"r\", \"f\", \"U\", \"\\u0000\", \"—\", \"S\", \"α\", \"诨\", \"W\", \"T\", \"犰\", \"耩\", \"⒂\", \"Y\", \"阽\", \"8\", \"5\", \"e\", \"鲎\", \"A\", \"z\", \"啐\", \"K\", \"L\", \"é\", \"t\", \"o\", \"\\u0005\", \"溘\", \"k\", \"–\", \"瑥\", \"A\", \"\", \"\\b\", \"⑿\", \"c\", \"ό\", \"Q\", \"\\u0006\", \"l\", \"s\", \" \", \"\", \"‘\", \"2\", \"ê\", \"逑\", \"\", \"O\", \"T\", \"鸩\", \"V\", \"黢\", \"旳\", \"0\", \"⒌\", \"瑒\", \"炝\", \"⒃\", \"ù\", \"g\", \"瑢\", \"J\", \"黧\", \"i\", \"P\", \"B\", \"瑧\", \"黩\", \"`\", \"p\", \"岣\", \"绉\", \"w\", \"篢\", \"1\", \"\\u0007\", \"―\", \"s\", \"ト\", \"n\", \"瑨\", \"4\", \"Z\", \"6\", \"3\", \"v\", \"N\", \"讦\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/ar": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2813283,
"_n_tokens": 310312,
"_n_chars": 1560987,
"_n_oov_chars": 1362316,
"oov_ratio": 0.8727273193178419,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"9\", \"G\", \"à\", \"r\", \"ب\", \"e\", \"M\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"x\", \"ذ\", \"😀\", \"خ\", \"“\", \"×\", \"د\", \"ۤ\", \"۰\", \"d\", \"y\", \"٨\", \"τ\", \"▫\", \"i\", \"®\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"’\", \"a\", \"ٌ\", \"😊\", \"ج\", \"h\", \"█\", \"¡\", \"‹\", \"m\", \"\", \"♥\", \"ن\", \"…\", \"7\", \"χ\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"â\", \"ا\", \"ھ\", \"”\", \"ئ\", \"٪\", \"پ\", \"ۗ\", \"ٹ\", \"R\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"آ\", \"٩\", \"j\", \"\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"b\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"f\", \"U\", \"μ\", \"—\", \"v\", \"S\", \"α\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"8\", \"5\", \"A\", \"z\", \"L\", \"é\", \"t\", \"o\", \"–\", \"\", \"k\", \"»\", \"Х\", \"﴿\", \"›\", \"c\", \"؛\", \"٠\", \"l\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"ﻹ\", \"ـ\", \"«\", \"O\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"←\", \"ً\", \"۸\", \"0\", \"ه\", \"ﻷ\", \"ؤ\", \"•\", \"أ\", \"ز\", \"g\", \"J\", \"٤\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"w\", \"ή\", \"1\", \"″\", \"ص\", \"ّ\", \"ث\", \"n\", \"η\", \"4\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/de": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1814876,
"_n_tokens": 384241,
"_n_chars": 1784021,
"_n_oov_chars": 3711,
"oov_ratio": 0.0020801324648084298,
"_oov_charset": "[\"©\", \"u\", \"¶\", \"İ\", \"ς\", \"➔\", \" \", \"¿\", \"N\", \"G\", \"9\", \"à\", \"☺\", \"ć\", \"r\", \"·\", \"¼\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"q\", \"x\", \"Ø\", \"😀\", \"‚\", \"“\", \"😦\", \"y\", \"τ\", \"û\", \"H\", \"°\", \"å\", \"’\", \"ó\", \"h\", \"\", \"‹\", \"č\", \"m\", \"£\", \"á\", \"▼\", \"→\", \"…\", \"♥\", \"7\", \"−\", \"â\", \"”\", \"œ\", \"R\", \"ç\", \"ε\", \"Ã\", \"ρ\", \"😉\", \"„\", \"ï\", \"‐\", \"Ÿ\", \"F\", \"C\", \"¹\", \"ú\", \"\", \"b\", \"�\", \"ń\", \"½\", \"™\", \"≠\", \"ί\", \"★\", \"̈\", \"🙂\", \"♡\", \"😂\", \"↩\", \"f\", \"U\", \"—\", \"É\", \"S\", \"α\", \"ι\", \"W\", \"T\", \"ö\", \"8\", \"5\", \"¬\", \"A\", \"😈\", \"K\", \"L\", \"é\", \"t\", \"k\", \"–\", \"❤\", \"»\", \"ė\", \"›\", \"🙄\", \"l\", \"s\", \"😆\", \"\", \"ø\", \"‘\", \"2\", \"ß\", \"3\", \"ā\", \"😢\", \"´\", \"«\", \"ô\", \"O\", \"ớ\", \"\", \"Á\", \"0\", \"•\", \"²\", \"g\", \"¤\", \"\", \"š\", \"B\", \"p\", \"‽\", \"w\", \"ư\", \"🙁\", \"1\", \"n\", \"↑\", \"4\", \"6\", \"♦\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/en": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1124813,
"_n_tokens": 429260,
"_n_chars": 1121360,
"_n_oov_chars": 1814,
"oov_ratio": 0.001617678533209674,
"_oov_charset": "[\"V\", \"—\", \"③\", \"¡\", \"0\", \"£\", \"⑧\", \"¦\", \"T\", \"9\", \"\", \"…\", \"•\", \"8\", \"è\", \"7\", \"5\", \"⑦\", \"A\", \"”\", \"q\", \"é\", \"‑\", \"–\", \"»\", \"B\", \"“\", \"😉\", \"ï\", \"®\", \"😥\", \"\", \"1\", \"⑤\", \"‘\", \"2\", \"ñ\", \"⑩\", \"\", \"\", \"b\", \"�\", \"4\", \"´\", \"’\", \"6\", \"\", \"«\", \"3\", \"🙂\", \"ó\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/es": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1664455,
"_n_tokens": 580233,
"_n_chars": 1630297,
"_n_oov_chars": 42728,
"oov_ratio": 0.026208721478356397,
"_oov_charset": "[\"©\", \"u\", \"¿\", \"N\", \"G\", \"à\", \"9\", \"r\", \"·\", \"e\", \"M\", \"è\", \"D\", \"q\", \"x\", \"😀\", \"Í\", \"“\", \"×\", \"😦\", \"d\", \"y\", \"ò\", \"X\", \"i\", \"º\", \"®\", \"H\", \"ª\", \"°\", \"Ñ\", \"✪\", \"\", \"👏\", \"’\", \"a\", \"ó\", \"■\", \"I\", \"h\", \"¡\", \"ý\", \"m\", \"á\", \"️\", \"→\", \"…\", \"í\", \"7\", \"”\", \"R\", \"▷\", \"😉\", \"j\", \"\", \"ñ\", \"F\", \"C\", \"ú\", \"✔\", \"b\", \"Ú\", \"🙂\", \"✖\", \"E\", \"✓\", \"f\", \"U\", \"—\", \"É\", \"S\", \"T\", \"ö\", \"Y\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"é\", \"t\", \"o\", \"–\", \"k\", \"»\", \"❤\", \"\", \"c\", \"Q\", \"l\", \"ü\", \"s\", \"👍\", \"ø\", \"‘\", \"2\", \"´\", \"«\", \"O\", \"ô\", \"Ó\", \"М\", \"V\", \"′\", \"←\", \"Á\", \"\", \"0\", \"•\", \"²\", \"g\", \"J\", \"\", \"P\", \"B\", \"p\", \"🙁\", \"1\", \"″\", \"―\", \"n\", \"Z\", \"4\", \"6\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/fa": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2054052,
"_n_tokens": 254518,
"_n_chars": 1145876,
"_n_oov_chars": 1029863,
"oov_ratio": 0.8987560608652245,
"_oov_charset": "[\"م\", \"©\", \"u\", \" \", \"۲\", \"ض\", \"G\", \"9\", \"r\", \"ب\", \"e\", \"·\", \"\", \"ق\", \"ط\", \"D\", \"إ\", \"ى\", \"▐\", \"q\", \"ذ\", \"خ\", \"×\", \"“\", \"د\", \"۰\", \"y\", \"٨\", \"i\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"’\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"h\", \"I\", \"✿\", \"m\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"7\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"”\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"b\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"ع\", \"ِ\", \"v\", \"S\", \"\", \"T\", \"١\", \"و\", \"8\", \"5\", \"A\", \"t\", \"o\", \"–\", \"\", \"k\", \"»\", \"❤\", \"ڪ\", \"c\", \"›\", \"؛\", \"Q\", \"ב\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"‘\", \"2\", \"٥\", \"٫\", \"ـ\", \"«\", \"●\", \"ٍ\", \"ش\", \"س\", \"۷\", \"V\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"•\", \"ز\", \"أ\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"ء\", \"گ\", \"۴\", \"1\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"n\", \"4\", \"6\", \"،\", \"3\", \"غ\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/fr": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1540504,
"_n_tokens": 530069,
"_n_chars": 1484970,
"_n_oov_chars": 59338,
"oov_ratio": 0.039959056411914044,
"_oov_charset": "[\"u\", \"♠\", \"N\", \"Â\", \"G\", \"à\", \"9\", \"r\", \"e\", \"·\", \"è\", \"M\", \"À\", \"D\", \"q\", \"x\", \"😀\", \"“\", \"y\", \"d\", \"ã\", \"Ê\", \"X\", \"û\", \"i\", \"®\", \"H\", \"°\", \"Ô\", \"’\", \"Ç\", \"a\", \"h\", \"I\", \"m\", \"…\", \"í\", \"7\", \"â\", \"℃\", \"ğ\", \"”\", \"œ\", \"R\", \"ç\", \"ë\", \"î\", \"😉\", \"ï\", \"‐\", \"j\", \"♕\", \"\", \"F\", \"C\", \"™\", \"b\", \"�\", \"̂\", \"★\", \"🙂\", \"E\", \"f\", \"U\", \"—\", \"É\", \"S\", \"T\", \"Y\", \"8\", \"5\", \"A\", \"z\", \"K\", \"L\", \"́\", \"é\", \"t\", \"o\", \"–\", \"k\", \"»\", \"❤\", \"c\", \"Q\", \"l\", \"s\", \"🤔\", \"ê\", \"2\", \"‘\", \"´\", \"«\", \"ô\", \"O\", \"V\", \"←\", \"0\", \"Î\", \"•\", \"²\", \"ù\", \"g\", \"̧\", \"J\", \"µ\", \"\", \"P\", \"B\", \"p\", \"w\", \"1\", \"″\", \"
\", \"È\", \"―\", \"n\", \"4\", \"6\", \"Z\", \"3\", \"v\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/ja": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1774770,
"_n_tokens": 318073,
"_n_chars": 603065,
"_n_oov_chars": 591814,
"oov_ratio": 0.9813436362581148,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"G\", \"又\", \"族\", \"青\", \"C\", \"王\", \"多\", \"婆\", \"D\", \"ラ\", \"ぃ\", \"✨\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \".\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"竹\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"示\", \"馬\", \"服\", \"腎\", \"皿\", \"態\", \"・\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"…\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"三\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"小\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"代\", \"箭\", \"喜\", \"g\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"氏\", \"紹\", \"城\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"―\", \"布\", \"杏\", \"歓\", \"撮\", \"部\", \"網\", \"間\", \"郷\", \"車\", \"タ\", \"閉\", \"教\", \"有\", \"八\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"陽\", \"貧\", \"余\", \"派\", \"西\", \"河\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"忠\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"→\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"宣\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"場\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"崎\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"的\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"「\", \"靴\", \"司\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"滝\", \"橋\", \"問\", \"旦\", \"副\", \"1\", \"核\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"v\", \"艦\", \"麓\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"秀\", \"完\", \"限\", \"学\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"地\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"行\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"本\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"鈴\", \"憤\", \"プ\", \"讐\", \",\", \"F\", \"令\", \"嫁\", \"頷\", \"盤\", \"松\", \"術\", \"治\", \"純\", \"薙\", \"遠\", \"国\", \"標\", \"算\", \"民\", \"店\", \"女\", \"則\", \"史\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"K\", \"曲\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"川\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"ヒ\", \"傘\", \"書\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"耳\", \"掲\", \"怠\", \"初\", \"•\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"p\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"介\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"?\", \"詐\", \"u\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"r\", \"索\", \"戦\", \"啓\", \"垠\", \"窪\", \"〆\", \"十\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"楊\", \"匡\", \"h\", \"浄\", \"止\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"北\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"文\", \"ヶ\", \"ε\", \"設\", \"幕\", \"不\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"秋\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"天\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"μ\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"W\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"c\", \"l\", \"公\", \"凱\", \"疇\", \"帝\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"光\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"J\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"e\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"明\", \"庁\", \"藤\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"エ\", \"著\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"’\", \"廉\", \"道\", \"a\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"I\", \"潟\", \"壊\", \"m\", \"犬\", \"勝\", \"恒\", \"傾\", \"巨\", \"。\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"吉\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"健\", \"銃\", \"閣\", \"衷\", \"点\", \"S\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"」\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"岡\", \"´\", \"鋲\", \"永\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"侍\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"男\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"朝\", \"支\", \"乏\", \"佇\", \"攻\", \"戸\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"4\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"志\", \"勘\", \"兎\", \"葉\", \"爾\", \"ㅂ\", \"を\", \"還\", \"版\", \"ム\", \"規\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"井\", \"汗\", \"黄\", \"春\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"-\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"四\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"力\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"U\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"o\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"我\", \"ス\", \"樹\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"伊\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"ハ\", \"蛇\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"家\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"年\", \"茨\", \"N\", \"途\", \"纏\", \"©\", \"他\", \"お\", \"云\", \"農\", \"N\", \"阿\", \"貴\", \"赦\", \"要\", \"弁\", \"金\", \"貸\", \"雄\", \"脇\", \"矢\", \"任\", \"ぴ\", \"東\", \"愕\", \"漫\", \"\", \"拷\", \"一\", \"飾\", \"慮\", \"糖\", \"宮\", \"貌\", \"郵\", \"谷\", \"鎖\", \"カ\", \"法\", \"該\", \"方\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"幸\", \"ゆ\", \"写\", \"博\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"C\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"島\", \"唇\", \"伏\", \"姥\", \"営\", \"E\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"8\", \"革\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"和\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"千\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"林\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"清\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"q\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"d\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"〈\", \"唱\", \"再\", \"桁\", \"😭\", \"Ⅶ\", \"ア\", \"子\", \"会\", \"数\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"國\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"原\", \"州\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"安\", \"掃\", \"極\", \"胚\", \"発\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"j\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"皇\", \"被\", \"外\", \"痴\", \"塵\", \"U\", \"李\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"A\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"»\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"品\", \"練\", \"詞\", \"ふ\", \"〉\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"坂\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \")\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"成\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"3\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"門\", \"ァ\", \"針\", \"資\", \"沢\", \"丁\", \"腫\", \"仁\", \"激\", \"x\", \"須\", \"泥\", \"立\", \"臆\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"平\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"五\", \"引\", \"暦\", \"来\", \"栽\", \"ズ\", \"蒙\", \"倍\", \"之\", \"球\", \"瓦\", \"舞\", \"歪\", \"堂\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"空\", \"呂\", \"f\", \"斧\", \"才\", \"゚\", \"—\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"上\", \"洒\", \"〜\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"香\", \"侵\", \"客\", \"移\", \"結\", \"陳\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"«\", \"O\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"佐\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"信\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"夏\", \"助\", \"丼\", \"ダ\", \"区\", \"n\", \"賛\", \"背\", \"預\", \"顔\", \"同\", \"工\", \"朗\", \"炉\", \"賭\", \"白\", \"蠍\", \"9\", \"M\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"y\", \"倫\", \"稀\", \"散\", \"H\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"ケ\", \"略\", \"森\", \"課\", \"呆\", \"料\", \"悶\", \"先\", \"浴\", \"恰\", \"墜\", \"新\", \"生\", \"7\", \"纒\", \"南\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"《\", \"ゥ\", \"哀\", \"尽\", \"出\", \"劉\", \"合\", \"ま\", \"割\", \"且\", \"状\", \"政\", \"仲\", \"沸\", \"∇\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"ω\", \"末\", \"腔\", \"水\", \"電\", \"¥\", \"煮\", \"採\", \"重\", \"施\", \"口\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"P\", \"B\", \"^\", \"遥\", \"税\", \"句\", \"睦\", \"丘\", \"山\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"名\", \"懸\", \"提\", \"昇\", \"久\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"宇\", \"策\", \"ノ\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"石\", \"低\", \"相\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"都\", \"奈\", \"じ\", \"捏\", \"漏\", \"烈\", \"■\", \"古\", \"磨\", \"長\", \"⇒\", \"弥\", \"忙\", \"應\", \"桑\", \"龍\", \"摩\", \"慈\", \"崔\", \"挫\", \"”\", \"英\", \"勉\", \"ワ\", \"↓\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"、\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"z\", \"幣\", \"見\", \"正\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"Q\", \"報\", \"況\", \"J\", \"s\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"2\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"街\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"火\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"土\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"(\", \"指\", \"能\", \"6\", \"村\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"後\", \" \", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"食\", \"署\", \"摘\", \"─\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"“\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"i\", \"循\", \"®\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"御\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"貝\", \"尚\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"木\", \"頓\", \"菊\", \"華\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"社\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"比\", \"b\", \"窒\", \"至\", \"夫\", \"綬\", \"鼓\", \"亭\", \"ホ\", \"揉\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"軍\", \"内\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"也\", \"狩\", \"歌\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"前\", \"詩\", \"0\", \"傷\", \"曹\", \"や\", \"》\", \"箇\", \"園\", \"瞑\", \"義\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"保\", \"執\", \"楓\", \"w\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"武\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"郎\", \"射\", \"嶽\", \"槃\", \"允\", \"綜\", \"瀬\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"宗\", \"に\", \"鹿\", \"豪\", \"捕\", \"X\", \"逆\", \"郡\", \"日\", \"吹\", \"寺\", \"絞\", \"騰\", \"江\", \"礁\", \"甚\", \"婚\", \"美\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"−\", \"澪\", \"筋\", \"情\", \"典\", \"良\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"省\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"/\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"氷\", \"次\", \"ガ\", \"[\", \"海\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"大\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"Z\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"定\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"分\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"風\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"元\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"京\", \"逸\", \"篤\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"T\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"5\", \"編\", \"心\", \"腹\", \"L\", \"郭\", \"ン\", \"–\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"章\", \"月\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"高\", \"贅\", \"随\", \"捺\", \"ト\", \"加\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"田\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"漢\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"野\", \"ャ\", \"娠\", \"烙\", \"Y\", \"鞄\", \"締\", \"昭\", \"e\", \"簡\", \"最\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"太\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"』\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \":\", \"V\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"手\", \"〟\", \"世\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"!\", \"啜\", \"人\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"″\", \"叫\", \"株\", \"丸\", \"↑\", \"俳\", \"蝶\", \"条\", \"荘\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"士\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"『\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"花\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"事\", \"宿\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"面\", \"主\", \"R\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"‐\", \"m\", \"中\", \"措\", \"語\", \"謬\", \"洩\", \"獄\", \"黙\", \"里\", \"厚\", \"★\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"ウ\", \"用\", \"拶\", \"星\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"真\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"仮\", \"二\", \"頬\", \"邸\", \"目\", \"瑞\", \"t\", \"」\", \"尋\", \"尺\", \"果\", \"k\", \"景\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"張\", \"在\", \"煩\", \"榴\", \"愛\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"下\", \"販\", \"訃\", \"裂\", \"神\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/ko": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 1524839,
"_n_tokens": 203846,
"_n_chars": 655190,
"_n_oov_chars": 500665,
"oov_ratio": 0.7641523832781331,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"族\", \"王\", \"갈\", \"싱\", \"체\", \"多\", \"D\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"竹\", \"백\", \"\", \"규\", \"德\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"三\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"代\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"城\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"部\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"有\", \"八\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"的\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"′\", \"엎\", \"귈\", \"캣\", \"튼\", \"「\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"1\", \"숏\", \"福\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"地\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"行\", \"벽\", \"甲\", \"£\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"F\", \"컸\", \"治\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"民\", \"女\", \"뜯\", \"략\", \"史\", \"따\", \"틸\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"川\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"•\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"十\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"北\", \"갯\", \"틴\", \"채\", \"앎\", \"文\", \"싹\", \"늬\", \"둡\", \"不\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"秋\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"天\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"c\", \"슝\", \"l\", \"왼\", \"㉿\", \"公\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"帝\", \"☆\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"光\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"明\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"’\", \"즙\", \"뺀\", \"道\", \"쳤\", \"a\", \"孝\", \"敬\", \"준\", \"I\", \"얏\", \"m\", \"겔\", \"犬\", \"확\", \"꾀\", \"잴\", \"똘\", \"。\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"±\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"S\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"」\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"永\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"男\", \"朝\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"志\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"春\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"家\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"年\", \"途\", \"©\", \"戊\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"金\", \"貸\", \"꾸\", \"雄\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"一\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"谷\", \"폄\", \"눔\", \"法\", \"方\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"C\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"8\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"和\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"林\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"〈\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"子\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"國\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"原\", \"믿\", \"팩\", \"싸\", \"움\", \"安\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"j\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"皇\", \"둬\", \"식\", \"被\", \"外\", \"얄\", \"α\", \"앰\", \"림\", \"蚩\", \"A\", \"혹\", \"»\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"〉\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"仁\", \"놨\", \"x\", \"됬\", \"立\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"平\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"五\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"之\", \"원\", \"갱\", \"레\", \"堂\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"f\", \"才\", \"—\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"上\", \"푸\", \"客\", \"結\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"‘\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"信\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"同\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"白\", \"9\", \"M\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"y\", \"H\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"新\", \"미\", \"生\", \"ⅲ\", \"7\", \"상\", \"짱\", \"南\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"《\", \"哀\", \"획\", \"뭉\", \"出\", \"젝\", \"合\", \"쩌\", \"탓\", \"페\", \"政\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"ω\", \"🤕\", \"水\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"口\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"山\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"相\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"×\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"古\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"摩\", \"묵\", \"”\", \"英\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"z\", \"빚\", \"덜\", \"◦\", \"正\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"Q\", \"劫\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"火\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"土\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"6\", \"常\", \"납\", \"後\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"食\", \"켐\", \"言\", \"펠\", \"“\", \"랐\", \"습\", \"i\", \"®\", \"侯\", \"강\", \"뛸\", \"색\", \"御\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"好\", \"韜\", \"華\", \"ㅅ\", \"社\", \"큐\", \"얽\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"b\", \"뼈\", \"比\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"0\", \"》\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"w\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"武\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"宗\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"日\", \"둘\", \"득\", \"°\", \"앙\", \"꿔\", \"譯\", \"江\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"美\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"海\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"大\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"Z\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"分\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"京\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"心\", \"L\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"章\", \"月\", \"완\", \"딸\", \"高\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"·\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"し\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"≤\", \"す\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"野\", \"직\", \"Y\", \"답\", \"昭\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"』\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"手\", \"껑\", \"땡\", \"돼\", \"世\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"人\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"『\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"事\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"面\", \"R\", \"主\", \"웠\", \"適\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"中\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"里\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"星\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"目\", \"t\", \"」\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"下\", \"는\", \"神\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google-bert/bert-base-german-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-german-cased",
"organization": "Google",
"vocab_size": 30000,
"_n_bytes": 2633047,
"_n_tokens": 881138,
"_n_chars": 927311,
"_n_oov_chars": 873542,
"oov_ratio": 0.9420162167816407,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"又\", \"鱼\", \"族\", \"青\", \"⒀\", \"撬\", \"C\", \"王\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \".\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"竹\", \"页\", \"狸\", \"挈\", \"\", \"贵\", \"噌\", \"德\", \"贱\", \"杆\", \"浙\", \"汐\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"示\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"・\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"…\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"三\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"小\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"龚\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"代\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"g\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"氏\", \"城\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"―\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"部\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"吆\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"有\", \"八\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"τ\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"西\", \"河\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"忠\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"→\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"宣\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"近\", \"培\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"崎\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"的\", \"杭\", \"【\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"●\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"「\", \"偿\", \"衬\", \"撐\", \"靴\", \"司\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"1\", \"笃\", \"核\", \"找\", \"闻\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"v\", \"麓\", \"栖\", \"葆\", \"潭\", \"瞠\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"秀\", \"陵\", \"戳\", \"完\", \"戾\", \"限\", \"学\", \"冯\", \"睐\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"地\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"~\", \"陈\", \"裙\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"行\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"本\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"锥\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \",\", \"令\", \"嫁\", \"松\", \"治\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"国\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"民\", \"店\", \"嫂\", \"女\", \"书\", \"跃\", \"耙\", \"史\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"K\", \"痊\", \"曲\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"川\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"耳\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"•\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"p\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"介\", \"骰\", \"捧\", \"体\", \"?\", \"疼\", \"邻\", \"u\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"r\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"十\", \"梦\", \"增\", \"沾\", \"渠\", \"饰\", \"Ø\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"h\", \"止\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"ὐ\", \"北\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"文\", \"冰\", \"蜴\", \"甜\", \"炙\", \"幕\", \"不\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"秋\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"天\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"c\", \"l\", \"公\", \"蟀\", \"馍\", \"咐\", \"帝\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"←\", \"锅\", \"勃\", \"样\", \"光\", \"幅\", \"卷\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"瘀\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"明\", \"藤\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"’\", \"廉\", \"道\", \"a\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"乒\", \"莘\", \"螃\", \"m\", \"犬\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"。\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"吉\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"健\", \"嗨\", \"D\", \"衷\", \"点\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"」\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"永\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"侍\", \"刊\", \"苛\", \"础\", \"佘\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"の\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"男\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"朝\", \"读\", \"蹒\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"戸\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"4\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"志\", \"较\", \"笛\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"版\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"井\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"嘤\", \"严\", \"春\", \"睑\", \"骏\", \"颉\", \"与\", \"骸\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"-\", \"偶\", \"莓\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"四\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"„\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"力\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"o\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"我\", \"煎\", \"颖\", \"九\", \"ê\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"伊\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"ù\", \"家\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"年\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"©\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"阿\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"金\", \"呦\", \"估\", \"值\", \"雄\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"一\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"谷\", \"厮\", \"枉\", \"纷\", \"法\", \"婶\", \"方\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"幸\", \"写\", \"博\", \"补\", \"夕\", \"匾\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"C\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"绽\", \"辈\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"8\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"é\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"和\", \"预\", \"娄\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"千\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"林\", \"瀚\", \"璃\", \"利\", \"矶\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"清\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"q\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"雳\", \"涕\", \"葩\", \"d\", \"掠\", \"付\", \"豚\", \"为\", \"昊\", \"靛\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"〈\", \"摞\", \"霸\", \"唱\", \"再\", \"蟋\", \"郴\", \"徇\", \"异\", \"子\", \"会\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"á\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"原\", \"州\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"へ\", \"安\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"皇\", \"列\", \"阜\", \"珊\", \"麾\", \"被\", \"稍\", \"外\", \"痴\", \"阂\", \"裔\", \"胀\", \"李\", \"论\", \"首\", \"α\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"纹\", \"洗\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"»\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"品\", \"〉\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"坂\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \")\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"成\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"3\", \"蹴\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"ς\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"門\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"仁\", \"激\", \"x\", \"臆\", \"泥\", \"立\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"平\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"五\", \"引\", \"袍\", \"来\", \"锤\", \"畑\", \"讪\", \"忿\", \"疵\", \"ズ\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"之\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"堂\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"空\", \"赞\", \"動\", \"才\", \"f\", \"翅\", \"斧\", \"—\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"上\", \"绞\", \"洒\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"香\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"‘\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"佐\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"ο\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"信\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"夏\", \"助\", \"扣\", \"锂\", \"区\", \"捂\", \"芬\", \"n\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"同\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"白\", \"梵\", \"9\", \"攸\", \"岑\", \"涉\", \"晰\", \"刚\", \"蝉\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"篷\", \"硕\", \"玉\", \"漠\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"哒\", \"伫\", \"畜\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"森\", \"柳\", \"料\", \"虽\", \"先\", \"呆\", \"浴\", \"俨\", \"鄯\", \"恰\", \"镉\", \"欢\", \"殉\", \"新\", \"办\", \"臂\", \"生\", \"惟\", \"7\", \"扼\", \"南\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"î\", \"遂\", \"《\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"出\", \"合\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"政\", \"状\", \"仲\", \"沸\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"水\", \"偎\", \"π\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"\", \"施\", \"口\", \"载\", \"炸\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"P\", \"莴\", \"税\", \"遥\", \"犀\", \"價\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"山\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"名\", \"肃\", \"舆\", \"谬\", \"提\", \"军\", \"撞\", \"久\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"宇\", \"策\", \"瑨\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"石\", \"弈\", \"帜\", \"低\", \"动\", \"奸\", \"相\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"×\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"都\", \"泛\", \"奈\", \"喧\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"古\", \"广\", \"■\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"弘\", \"挫\", \"饷\", \"英\", \"”\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"、\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"z\", \"后\", \"蠢\", \"锐\", \"正\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"2\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"街\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"火\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"土\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"(\", \"指\", \"能\", \"沧\", \"6\", \"村\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \" \", \"檀\", \"血\", \"後\", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"氰\", \"必\", \"均\", \"无\", \"食\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"─\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"“\", \"踱\", \"茄\", \"仕\", \"庄\", \"急\", \"峨\", \"浆\", \"舶\", \"桓\", \"进\", \"i\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"御\", \"辩\", \"朔\", \"柠\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"尚\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"疹\", \"评\", \"好\", \"木\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"择\", \"勇\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"社\", \"岁\", \"战\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"比\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"夫\", \"鼓\", \"舰\", \"诫\", \"伉\", \"亭\", \"曾\", \"揉\", \"茂\", \"皙\", \"旷\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"内\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"也\", \"蚀\", \"狩\", \"歌\", \"啪\", \"聂\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"前\", \"唉\", \"0\", \"剔\", \"曹\", \"》\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"保\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"武\", \"固\", \"玄\", \"禾\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"郎\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"宗\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"咖\", \"薯\", \"郡\", \"逆\", \"日\", \"传\", \"吹\", \"寺\", \"°\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"江\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"ě\", \"莫\", \"美\", \"婚\", \"迭\", \"鹑\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"良\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"省\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"/\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"海\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"大\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"定\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"分\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"元\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"京\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"迩\", \"印\", \"○\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"5\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"心\", \"腹\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"–\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"▪\", \"憋\", \"阎\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"月\", \"奥\", \"章\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"高\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"ト\", \"奖\", \"加\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"·\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"ç\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"田\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"野\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"绰\", \"苏\", \"e\", \"昭\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"太\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"』\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \":\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"手\", \"溉\", \"摹\", \"拆\", \"瞪\", \"世\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"!\", \"啜\", \"人\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"↑\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"士\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"à\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"『\", \"膜\", \"邂\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"花\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"镇\", \"峻\", \"事\", \"眯\", \"晨\", \"宿\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"面\", \"主\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"中\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"里\", \"搜\", \"芙\", \"厚\", \"★\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"星\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"真\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"二\", \"邸\", \"膳\", \"对\", \"目\", \"瑞\", \"测\", \"t\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"k\", \"何\", \"遮\", \"擂\", \"ό\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"下\", \"马\", \"裂\", \"瀛\", \"皑\", \"神\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ar": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2813283,
"_n_tokens": 627501,
"_n_chars": 1560987,
"_n_oov_chars": 1842,
"oov_ratio": 0.0011800226395223023,
"_oov_charset": "[\"ع\", \"م\", \"ِ\", \"↩\", \"٧\", \"😊\", \"—\", \"ض\", \"ﻻ\", \"ٱ\", \"١\", \"ﻷ\", \"\", \"…\", \"ب\", \"و\", \"أ\", \"\", \"⤴\", \"ۚ\", \"”\", \"ۗ\", \"ذ\", \"–\", \"\", \"ۖ\", \"😀\", \"“\", \"ۤ\", \"َ\", \"٠\", \"آ\", \"٨\", \"▫\", \"٩\", \"\", \"\", \"‘\", \"ّ\", \"ك\", \"\", \"٢\", \"٦\", \"�\", \"
\", \"ٰ\", \"ث\", \"ح\", \"ﻹ\", \"’\", \"ـ\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/de": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1814876,
"_n_tokens": 445764,
"_n_chars": 1784021,
"_n_oov_chars": 2289,
"oov_ratio": 0.0012830566456336556,
"_oov_charset": "[\"u\", \"↩\", \"f\", \"😂\", \"—\", \"h\", \"\", \"➔\", \"\", \" \", \"N\", \"G\", \"☺\", \"…\", \"¼\", \"😃\", \"M\", \"\", \"\", \"g\", \"¤\", \"D\", \"K\", \"😈\", \"L\", \"”\", \"x\", \"t\", \"R\", \"k\", \"–\", \"\", \"❤\", \"😀\", \"Ã\", \"`\", \"p\", \"“\", \"😦\", \"🙄\", \"‽\", \"l\", \"😉\", \"y\", \"w\", \"s\", \"🙁\", \"‐\", \"😆\", \"\", \"Ÿ\", \"F\", \"‘\", \"ß\", \"\", \"b\", \"�\", \"😢\", \"n\", \"´\", \"’\", \"̈\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/en": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1124813,
"_n_tokens": 280462,
"_n_chars": 1121360,
"_n_oov_chars": 1668,
"oov_ratio": 0.0014874794891916957,
"_oov_charset": "[\"—\", \"⑧\", \"T\", \"\", \"…\", \"⑦\", \"”\", \"‑\", \"–\", \"“\", \"😉\", \"😥\", \"\", \"‘\", \"⑩\", \"\", \"\", \"�\", \"´\", \"’\", \"\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/es": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1664455,
"_n_tokens": 405970,
"_n_chars": 1630297,
"_n_oov_chars": 2197,
"oov_ratio": 0.0013476072151270596,
"_oov_charset": "[\"✓\", \"—\", \"I\", \"v\", \"\", \"S\", \"️\", \"…\", \"z\", \"”\", \"–\", \"▷\", \"\", \"❤\", \"😀\", \"\", \"“\", \"😦\", \"😉\", \"🙁\", \"👍\", \"\", \"‘\", \"✪\", \"✔\", \"\", \"―\", \"👏\", \"´\", \"’\", \"🙂\", \"✖\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/fa": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2054052,
"_n_tokens": 400799,
"_n_chars": 1145876,
"_n_oov_chars": 8049,
"oov_ratio": 0.0070243202580383916,
"_oov_charset": "[\"٧\", \"✿\", \"\", \"️\", \"١\", \"\", \"…\", \"♥\", \"ن\", \"\", \"ط\", \"ق\", \"▐\", \"”\", \"–\", \"\", \"\", \"❤\", \"◄\", \"“\", \"ڪ\", \"د\", \"گ\", \"٨\", \"\", \"‘\", \"٢\", \"\", \"�\", \"ﮧ\", \"’\", \"ٴ\", \"★\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/fr": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1540504,
"_n_tokens": 396708,
"_n_chars": 1484970,
"_n_oov_chars": 7211,
"oov_ratio": 0.004855990356707543,
"_oov_charset": "[\"—\", \"h\", \"…\", \"è\", \"”\", \"–\", \"\", \"😀\", \"❤\", \"“\", \"😉\", \"‐\", \"🤔\", \"\", \"‘\", \"C\", \"
\", \"―\", \"�\", \"´\", \"’\", \"̂\", \"🙂\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ja": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1774770,
"_n_tokens": 469446,
"_n_chars": 603065,
"_n_oov_chars": 3448,
"oov_ratio": 0.005717459975292879,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"あ\", \"ペ\", \"5\", \"ら\", \"お\", \"n\", \"サ\", \"つ\", \"タ\", \"N\", \"ア\", \"セ\", \"W\", \"彡\", \"f\", \"C\", \"を\", \"ㅂ\", \"M\", \"L\", \"め\", \"∀\", \"ナ\", \"✨\", \"〆\", \"ラ\", \"び\", \"ム\", \"ハ\", \"よ\", \"フ\", \"M\", \"に\", \"Q\", \"“\", \"゙\", \"嚥\", \"た\", \"し\", \"\", \"~\", \"I\", \"エ\", \"欝\", \"け\", \"噤\", \"Ⅱ\", \"く\", \"K\", \"⑩\", \"じ\", \"😭\", \"カ\", \"Ⅶ\", \"ゃ\", \"’\", \"ア\", \"ぅ\", \"t\", \"a\", \"ネ\", \"R\", \"り\", \"そ\", \"と\", \"ジ\", \"g\", \"ク\", \"ィ\", \"😊\", \"レ\", \"I\", \"が\", \"ル\", \"オ\", \"メ\", \"V\", \"て\", \"4\", \"Z\", \"…\", \"¥\", \"纒\", \"⑪\", \"艸\", \"🌙\", \"”\", \"は\", \"ゎ\", \"フ\", \"へ\", \"o\", \"ほ\", \"▷\", \"か\", \"ワ\", \"d\", \"ち\", \"G\", \"ズ\", \"こ\", \"▽\", \"D\", \"︎\", \"\", \"コ\", \"え\", \"F\", \"◯\", \"う\", \"リ\", \"ゥ\", \"ビ\", \"プ\", \"‐\", \"\\u001b\", \"m\", \"逡\", \"ま\", \"頷\", \"O\", \"E\", \"😌\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"贔\", \"P\", \"ョ\", \"=\", \"̈\", \"ぉ\", \"ホ\", \"み\", \"ウ\", \"ポ\", \"r\", \"せ\", \"3\", \"ド\", \"゚\", \"ゼ\", \"—\", \"ッ\", \"す\", \"H\", \"S\", \"U\", \"ブ\", \"ャ\", \"○\", \"ヨ\", \"و\", \"8\", \"5\", \"e\", \"A\", \"8\", \"Y\", \"K\", \"ず\", \"ン\", \"な\", \"–\", \"イ\", \"A\", \"❤\", \"\\b\", \"‼\", \"⻑\", \"㎞\", \"き\", \"💦\", \"ツ\", \"れ\", \"J\", \"2\", \"モ\", \"丿\", \"コ\", \" \", \"ど\", \"ヽ\", \"\", \"い\", \"だ\", \"ス\", \"B\", \"テ\", \"2\", \"̀\", \"☆\", \"ヒ\", \"バ\", \"ふ\", \"😢\", \"$\", \"´\", \"゙\", \"⌒\", \"鋲\", \"瘻\", \"●\", \"O\", \"T\", \"ゲ\", \"l\", \"る\", \"ヾ\", \"V\", \"0\", \"シ\", \"ィ\", \"マ\", \"ハ\", \"キ\", \"w\", \"ご\", \"屓\", \"メ\", \"リ\", \"0\", \"の\", \"や\", \"⑧\", \"〟\", \"わ\", \"パ\", \"カ\", \"ミ\", \"詈\", \"ね\", \"S\", \"ロ\", \"ひ\", \"゚\", \"`\", \" ̄\", \"レ\", \"i\", \"も\", \"ん\", \"♫\", \"b\", \"B\", \"^\", \"X\", \"`\", \"6\", \"Д\", \"チ\", \"で\", \"テ\", \"1\", \"躾\", \"ノ\", \"さ\", \"っ\", \"1\", \"―\", \"s\", \"ザ\", \"ト\", \"✧\", \"ノ\", \"ヘ\", \"6\", \"◡\", \"ろ\", \"k\", \"ー\", \"ば\", \"N\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/ko": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 1524839,
"_n_tokens": 427953,
"_n_chars": 655190,
"_n_oov_chars": 8356,
"oov_ratio": 0.012753552404645981,
"_oov_charset": "[\"뮈\", \"ⓒ\", \"잖\", \"은\", \"전\", \"😗\", \"샵\", \"을\", \"필\", \"ㄷ\", \"헛\", \"츠\", \"G\", \"절\", \"빈\", \"e\", \"스\", \"로\", \"갈\", \"체\", \"씹\", \"싱\", \"\", \"긴\", \"빤\", \"ㅐ\", \"D\", \"논\", \"갓\", \"놨\", \"됬\", \"잔\", \"틀\", \"윙\", \"각\", \"쨍\", \"ㅛ\", \"섬\", \"쵸\", \"껀\", \"과\", \"🍕\", \"X\", \"댄\", \"맬\", \"🍎\", \"내\", \"킌\", \"🦅\", \"겨\", \"엌\", \"쪄\", \"🚨\", \"득\", \"앙\", \"션\", \"\", \"히\", \"🚿\", \"👏\", \"갑\", \"뱉\", \"’\", \"즙\", \"뺀\", \"💸\", \"활\", \"램\", \"a\", \"짭\", \"망\", \"호\", \"뵐\", \"쫄\", \"얏\", \"솥\", \"왔\", \"라\", \"☎\", \"▒\", \"잠\", \"월\", \"잴\", \"똘\", \"…\", \"임\", \"ㅏ\", \"왠\", \"콩\", \"땀\", \"ㅔ\", \"빠\", \"ㄴ\", \"셔\", \"댁\", \"씬\", \"ㅣ\", \"갉\", \"쭙\", \"죤\", \"간\", \"닭\", \"시\", \"흠\", \"툭\", \"욜\", \"봬\", \"세\", \"검\", \"\", \"원\", \"쓰\", \"국\", \"봅\", \"갱\", \"녕\", \"레\", \"췄\", \"팹\", \"첫\", \"력\", \"토\", \"님\", \"⑸\", \"콰\", \"깜\", \"짠\", \"璣\", \"갖\", \"면\", \"엠\", \"쬐\", \"떡\", \"ᴀ\", \"화\", \"쉰\", \"쥬\", \"놔\", \"방\", \"반\", \"—\", \"ㄱ\", \"S\", \"ㆍ\", \"에\", \"햇\", \"ㅈ\", \"진\", \"쭈\", \"찬\", \"숱\", \"ʏ\", \"梁\", \"냈\", \"쒀\", \"⑨\", \"🔹\", \"푸\", \"뜹\", \"한\", \"표\", \"승\", \"ㅕ\", \"陸\", \"🤭\", \"배\", \"먹\", \"커\", \"궜\", \"👨\", \"ᴛ\", \"재\", \"헉\", \"樂\", \"목\", \"선\", \"쎈\", \"테\", \"빗\", \"쫒\", \"‘\", \"◈\", \"골\", \"겠\", \"ㅍ\", \"얀\", \"理\", \"떠\", \"베\", \"텀\", \"욥\", \"꿀\", \"를\", \"밤\", \"더\", \"빴\", \"튄\", \"차\", \"덴\", \"숟\", \"ㅘ\", \"캄\", \"튀\", \"쏠\", \"짖\", \"밉\", \"짢\", \"공\", \"쁠\", \"론\", \"땠\", \"메\", \"든\", \"센\", \"듐\", \"구\", \"블\", \"텔\", \"궈\", \"켜\", \"🍰\", \"숯\", \"뺐\", \"폍\", \"턱\", \"뭥\", \"ⅱ\", \"g\", \"짐\", \"쑥\", \"엡\", \"팠\", \"칵\", \"챗\", \"ⅰ\", \"격\", \"털\", \"ㅞ\", \"탄\", \"동\", \"잣\", \"챙\", \"`\", \"댔\", \"㉣\", \"💅\", \"저\", \"워\", \"Ⅴ\", \"왁\", \"빙\", \"꽁\", \"금\", \"리\", \"◼\", \"맙\", \"\", \"섣\", \"케\", \"ㅟ\", \"㎥\", \"찢\", \"믐\", \"識\", \"🤗\", \"폭\", \"닙\", \"―\", \"풀\", \"솨\", \"신\", \"n\", \"북\", \"4\", \"패\", \"삘\", \"㉰\", \"본\", \"초\", \"쾨\", \"줍\", \"질\", \"🌿\", \"코\", \"뼘\", \"켤\", \"장\", \"역\", \"9\", \"덥\", \"굶\", \"M\", \"셸\", \"➎\", \"뺑\", \"뜰\", \"영\", \"ᴡ\", \"첨\", \"외\", \"탈\", \"셈\", \"눕\", \"Ⅷ\", \"퍽\", \"줬\", \"퓰\", \"🏷\", \"나\", \"켠\", \"려\", \"킁\", \"H\", \"뉴\", \"흐\", \"제\", \"걍\", \"ㅝ\", \"⚀\", \"킷\", \"벨\", \"쩐\", \"ㄹ\", \"낍\", \"쐬\", \"깽\", \"웨\", \"암\", \"띕\", \"갛\", \"짊\", \"㏊\", \"폈\", \"푹\", \"입\", \"ᴍ\", \"소\", \"Ⅵ\", \"쪼\", \"덕\", \"꼴\", \"㎍\", \"뜸\", \"눈\", \"미\", \"ⅲ\", \"셌\", \"7\", \"까\", \"💕\", \"상\", \"볕\", \"취\", \"봉\", \"ㅇ\", \"분\", \"쳇\", \"▷\", \"거\", \"봤\", \"룩\", \"롸\", \"쉘\", \"줏\", \"획\", \"뭉\", \"뽀\", \"쉽\", \"끄\", \"쳐\", \"✈\", \"넉\", \"료\", \"여\", \"페\", \"ⅳ\", \"퀵\", \"�\", \"빨\", \"올\", \"벅\", \"괌\", \"연\", \"쟈\", \"너\", \"녘\", \"😂\", \"△\", \"ⓔ\", \"딤\", \"행\", \"◐\", \"개\", \"고\", \"걱\", \"겟\", \"하\", \"◾\", \"이\", \"꽝\", \"T\", \"○\", \"늘\", \"㎡\", \"평\", \"ㅑ\", \"잤\", \"폿\", \"짚\", \"곡\", \"ㅓ\", \"L\", \"ᴄ\", \"옹\", \"솔\", \"몬\", \"–\", \"뽐\", \"콜\", \"닳\", \"쓕\", \"버\", \"깅\", \"쾅\", \"ㅊ\", \"💦\", \"듯\", \"ㅚ\", \"쫀\", \"긁\", \"쥔\", \"텐\", \"◑\", \"포\", \"염\", \"브\", \"🤔\", \"짝\", \"웁\", \"멘\", \"만\", \"닷\", \"픕\", \"감\", \"맞\", \"켓\", \"카\", \"뻔\", \"딱\", \"ㅆ\", \"튿\", \"☀\", \"칸\", \"적\", \"똥\", \"쫗\", \"쿰\", \"샀\", \"현\", \"비\", \"삭\", \"닉\", \"⑹\", \"◀\", \"떳\", \"왕\", \"달\", \"엎\", \"클\", \"🤕\", \"귈\", \"팎\", \"뮐\", \"㈜\", \"ㅗ\", \"짓\", \"🙇\", \"경\", \"不\", \"퍼\", \"🙆\", \"게\", \"⑦\", \"🍟\", \"란\", \"민\", \"탰\", \"綃\", \"충\", \"밧\", \"있\", \"累\", \"🙋\", \"억\", \"⑵\", \"뱃\", \"ㅠ\", \"P\", \"B\", \"랑\", \"온\", \"맨\", \"🙌\", \"땅\", \"뭘\", \"길\", \"핥\", \"떄\", \"\", \"🌳\", \"중\", \"칼\", \"😱\", \"인\", \"흗\", \"괜\", \"빡\", \"천\", \"ㅎ\", \"1\", \"완\", \"숏\", \"🥁\", \"통\", \"데\", \"급\", \"르\", \"퀀\", \"누\", \"유\", \"얍\", \"번\", \"삐\", \"렵\", \"퍙\", \"릭\", \"째\", \"루\", \"핏\", \"눴\", \"헬\", \"女\", \"💥\", \"趺\", \"N\", \"젠\", \"뻐\", \"령\", \"트\", \"➋\", \"悧\", \"ㅜ\", \"🦄\", \"♀\", \"녜\", \"린\", \"💰\", \"틋\", \"팔\", \"꾸\", \"사\", \"뎅\", \"잡\", \"좋\", \"〮\", \"쏭\", \"좇\", \"쩍\", \"증\", \"타\", \"됩\", \"뺏\", \"꽂\", \"빛\", \"향\", \"줘\", \"빕\", \"몽\", \"➏\", \"걔\", \"쫑\", \"❍\", \"욱\", \"띈\", \"홑\", \"폄\", \"눔\", \"예\", \"찼\", \"썅\", \"힉\", \"볼\", \"😊\", \"캐\", \"햄\", \"섦\", \"그\", \"펩\", \"ㅡ\", \"독\", \"쟤\", \"ㅖ\", \"찜\", \"뻤\", \"뻑\", \"랜\", \"생\", \"대\", \"챨\", \"”\", \"노\", \"냄\", \"뀔\", \"💌\", \"용\", \"산\", \"껴\", \"옵\", \"귤\", \"남\", \"꺄\", \"꿍\", \"즈\", \"렸\", \"족\", \"F\", \"힜\", \"터\", \"샴\", \"돌\", \"C\", \"✔\", \"촘\", \"Ⅹ\", \"디\", \"뎀\", \"크\", \"군\", \"석\", \"정\", \"겼\", \"넵\", \"E\", \"킵\", \"뮤\", \"슬\", \"뗀\", \"뜯\", \"쌩\", \"틸\", \"박\", \"회\", \"뛴\", \"🍔\", \"\", \"ㅢ\", \"켰\", \"측\", \"쩡\", \"볶\", \"실\", \"ɪ\", \"8\", \"답\", \"힌\", \"변\", \"덜\", \"K\", \"◦\", \"▶\", \"살\", \"되\", \"썹\", \"깔\", \"오\", \"훑\", \"엘\", \"른\", \"머\", \"와\", \"수\", \"㎞\", \"롬\", \"꽉\", \"난\", \"웖\", \"뜩\", \"니\", \"s\", \"流\", \"👋\", \"🍭\", \"➍\", \"👍\", \"땐\", \"바\", \"\", \"잰\", \"설\", \"😣\", \"v\", \"2\", \"끽\", \"플\", \"퀄\", \"ᴏ\", \"새\", \"춧\", \"몰\", \"성\", \"러\", \"칫\", \"흥\", \"➌\", \"맴\", \"다\", \"좆\", \"롤\", \"냐\", \"래\", \"냅\", \"金\", \"불\", \"존\", \"들\", \"깐\", \"⑴\", \"물\", \"말\", \"껑\", \"땡\", \"보\", \"져\", \"썸\", \"낯\", \"쏙\", \"뵙\", \"냠\", \"당\", \"뚜\", \"\", \"랍\", \"락\", \"♧\", \"능\", \"며\", \"했\", \"▣\", \"없\", \"쎄\", \"밥\", \"쐐\", \"요\", \"꺽\", \"던\", \"힘\", \"☞\", \"었\", \"s\", \"업\", \"槪\", \"ᴇ\", \"꿕\", \"6\", \"팅\", \"팬\", \"키\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"❏\", \"춥\", \" \", \"일\", \"빅\", \"잼\", \"팰\", \"릉\", \"텅\", \"잘\", \"우\", \"짤\", \"쨌\", \"켐\", \"안\", \"가\", \"줄\", \"팥\", \"➊\", \"칠\", \"기\", \"“\", \"언\", \"씽\", \"훅\", \"습\", \"🏫\", \"자\", \"i\", \"跏\", \"강\", \"의\", \"뛸\", \"삣\", \"핀\", \"색\", \"😭\", \"판\", \"Ⅶ\", \"퀘\", \"쌈\", \"죠\", \"년\", \"젓\", \"작\", \"권\", \"⑶\", \"낮\", \"훠\", \"밌\", \"두\", \"모\", \"️\", \"채\", \"앎\", \"훌\", \"ㅅ\", \"극\", \"해\", \"큐\", \"집\", \"걸\", \"샷\", \"︎\", \"둡\", \"단\", \"짬\", \"음\", \"팜\", \"출\", \"헨\", \"조\", \"돠\", \"🌵\", \"🗺\", \"틔\", \"근\", \"서\", \"넹\", \"쿡\", \"지\", \"끙\", \"같\", \"결\", \"ㅁ\", \"위\", \"투\", \"삼\", \"픽\", \"창\", \"⬇\", \"꼬\", \"↕\", \"멕\", \"청\", \"츈\", \"캇\", \"웍\", \"쌉\", \"텁\", \"꿰\", \"믄\", \"봐\", \"프\", \"네\", \"둬\", \"㉠\", \"야\", \"피\", \"엔\", \"읊\", \"명\", \"뿜\", \"딘\", \"앰\", \"큽\", \"엽\", \"W\", \"무\", \"ㅋ\", \"글\", \"셨\", \"으\", \"🍞\", \"씻\", \"A\", \"쉼\", \"靈\", \"t\", \"빳\", \"쿵\", \"Ⅸ\", \"k\", \"막\", \"💡\", \"렜\", \"❤\", \"알\", \"뷰\", \"龍\", \"품\", \"얼\", \"슝\", \"뾱\", \"㉿\", \"팁\", \"범\", \"끔\", \"🤟\", \"날\", \" \", \"계\", \"떴\", \"뿍\", \"톡\", \"홍\", \"섭\", \"ʟ\", \"슈\", \"卽\", \"깡\", \"왘\", \"쿠\", \"컴\", \"흄\", \"♤\", \"파\", \"⑥\", \"텨\", \"릅\", \"💣\", \"갭\", \"0\", \"꿇\", \"치\", \"⑧\", \"ㅒ\", \"발\", \"벙\", \"🏻\", \"철\", \"맛\", \"∮\", \"운\", \"광\", \"웰\", \"아\", \"드\", \"함\", \"飮\", \"룬\", \"놓\", \"마\", \"혀\", \"휙\", \"ㅙ\", \"낚\", \"立\", \"합\", \"웅\", \"주\", \"할\", \"울\", \"어\", \"담\", \"듬\", \"부\", \"는\", \"황\", \"객\", \"헝\", \"딛\", \"많\", \"티\", \"형\", \"樂\", \"속\", \"뒤\", \"추\", \"도\", \"3\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-cased @ cc100/zh-Hans": {
"tokenizer": "bert-base-multilingual-cased",
"organization": "Google",
"vocab_size": 119547,
"_n_bytes": 2633047,
"_n_tokens": 878811,
"_n_chars": 927311,
"_n_oov_chars": 29299,
"oov_ratio": 0.03159565668907195,
"_oov_charset": "[\"a\", \"擤\", \"搀\", \"\", \"狈\", \"瘙\", \"叨\", \"锲\", \"噼\", \"⒀\", \"C\", \"撬\", \"淌\", \"浠\", \"蕤\", \"褂\", \"嘣\", \"抡\", \"犄\", \"玷\", \"挈\", \"馕\", \"铛\", \"籁\", \"⑩\", \"\", \"吆\", \"秆\", \"吮\", \"’\", \"惫\", \"t\", \"呸\", \"腭\", \"鹑\", \"苒\", \"剐\", \"孱\", \"嘈\", \"啕\", \"旆\", \"吱\", \"魇\", \"…\", \"跷\", \"旖\", \"嗲\", \"遑\", \"d\", \"憔\", \"旎\", \"⒁\", \"讪\", \"\", \"屄\", \"蹩\", \"炖\", \"掂\", \"懊\", \"⑸\", \"馒\", \"橱\", \"撩\", \"咦\", \"\\u0000\", \"—\", \"嗨\", \"耩\", \"⒂\", \"⑨\", \"霭\", \"撷\", \"喽\", \"磕\", \"\", \"蓦\", \"哧\", \"吭\", \"滢\", \"獗\", \"傥\", \"屉\", \"颧\", \"锏\", \"踹\", \"‘\", \"赘\", \"逑\", \"搡\", \"涣\", \"崽\", \"铩\", \"旳\", \"坯\", \"挲\", \"掰\", \"蘸\", \"粼\", \"嚷\", \"纨\", \"癜\", \"蹒\", \"瑧\", \"`\", \"咙\", \"馋\", \"绉\", \"诙\", \"谧\", \"饽\", \"瘩\", \"盹\", \"刨\", \"\\u0007\", \"―\", \"捂\", \"肮\", \"拧\", \"讦\", \"瞟\", \"窍\", \"翕\", \"撸\", \"缈\", \"镏\", \"饨\", \"阑\", \"楂\", \"鬓\", \"冽\", \"攥\", \"牖\", \"擞\", \"裆\", \"诶\", \"戢\", \"眨\", \"呗\", \"骛\", \"倨\", \"樯\", \"哒\", \"伫\", \"咔\", \"嘤\", \"p\", \"蹿\", \"睑\", \"镉\", \"猬\", \"茏\", \"韪\", \"瞅\", \"攒\", \"诟\", \"臊\", \"毡\", \"懵\", \"D\", \"忪\", \"\", \"掐\", \"墒\", \"h\", \"�\", \"唏\", \"泯\", \"惴\", \"荤\", \"蹭\", \"赅\", \"嵘\", \"纰\", \"啐\", \"璎\", \"–\", \"鹕\", \"\\b\", \"埂\", \"揍\", \"赡\", \"郅\", \"怂\", \"泱\", \"棂\", \"诧\", \"惦\", \"T\", \"憋\", \"峥\", \"偎\", \"嗯\", \"⒌\", \"炝\", \"搐\", \"⑦\", \"狰\", \"咧\", \"瑢\", \"黧\", \"屌\", \"烬\", \"莴\", \"姣\", \"黩\", \"缜\", \"荨\", \"岣\", \"唠\", \"舀\", \"炕\", \"1\", \"矍\", \"惭\", \"礴\", \"瑨\", \"∶\", \"捅\", \"N\", \"瞠\", \"篓\", \"猡\", \"ㄓ\", \"n\", \"嗡\", \"噢\", \"奂\", \"惬\", \"缥\", \"擀\", \"呦\", \"胧\", \"忡\", \"浞\", \"汩\", \"厮\", \"踌\", \"韫\", \"啃\", \"疙\", \"锒\", \"嗔\", \"祛\", \"V\", \"扪\", \"膊\", \"佝\", \"芃\", \"”\", \"o\", \"呃\", \"孪\", \"缄\", \"沏\", \"遢\", \"谆\", \"叼\", \"跚\", \"瑑\", \"惋\", \"狳\", \"搂\", \"犷\", \"痫\", \"挎\", \"臃\", \"睬\", \"嗤\", \"抿\", \"茁\", \"笆\", \"诨\", \"萦\", \"犰\", \"阽\", \"鲎\", \"e\", \"⑿\", \"胫\", \"烊\", \"嗦\", \"倜\", \"\", \"愣\", \"\", \"肓\", \"黢\", \"邋\", \"鼾\", \"蚯\", \"忐\", \"⑴\", \"瑒\", \"飕\", \"怔\", \"遛\", \"惘\", \"鹌\", \"篢\", \"啬\", \"唬\", \"剁\", \"哎\", \"撅\", \"s\", \"呻\", \"逶\", \" \", \"汹\", \"侥\", \"鼯\", \"屣\", \"馁\", \"馄\", \"“\", \"踱\", \"觑\", \"葩\", \"涮\", \"铤\", \"眯\", \"摞\", \"懑\", \"疴\", \"狞\", \"秸\", \"蛔\", \"⑶\", \"铄\", \"鹜\", \"抠\", \"忑\", \"⑷\", \"犟\", \"咚\", \"婊\", \"铣\", \"谩\", \"〞\", \"龇\", \"偌\", \"聒\", \"\", \"皙\", \"r\", \"镳\", \"噱\", \"偻\", \"阂\", \"怵\", \"熨\", \"啥\", \"谑\", \"缭\", \"\\u0005\", \"溘\", \"瑥\", \"A\", \"酝\", \"\\u0006\", \"睁\", \"蔼\", \"啪\", \"蟀\", \"馍\", \" \", \"迤\", \"晾\", \"鸩\", \"黝\", \"谀\", \"倏\", \"绷\", \"⑥\", \"霈\", \"拎\", \"唉\", \"飚\", \"⑧\", \"唷\", \"⒃\", \"哟\", \"呷\", \"悴\", \"胳\", \"i\", \"嘭\", \"⒋\", \"碴\", \"欸\", \"皑\", \"嘀\", \"拽\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ar": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2813283,
"_n_tokens": 586110,
"_n_chars": 1560987,
"_n_oov_chars": 71448,
"oov_ratio": 0.0457710410144351,
"_oov_charset": "[\"م\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"G\", \"à\", \"ب\", \"M\", \"\", \"D\", \"إ\", \"ذ\", \"😀\", \"“\", \"ۤ\", \"X\", \"▫\", \"H\", \"\", \"
\", \"ْ\", \"’\", \"ٌ\", \"😊\", \"I\", \"\", \"…\", \"⤴\", \"ۚ\", \"â\", \"”\", \"ئ\", \"ۗ\", \"R\", \"ۖ\", \"َ\", \"آ\", \"\", \"F\", \"C\", \"ك\", \"ٰ\", \"�\", \"ح\", \"ί\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"—\", \"S\", \"W\", \"T\", \"Y\", \"ö\", \"و\", \"A\", \"K\", \"L\", \"é\", \"–\", \"\", \"Х\", \"Q\", \"\", \"ُ\", \"‘\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"V\", \"ً\", \"ﻷ\", \"ؤ\", \"أ\", \"J\", \"B\", \"P\", \"ή\", \"ä\", \"ّ\", \"ث\", \"Z\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/de": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1814876,
"_n_tokens": 425738,
"_n_chars": 1784021,
"_n_oov_chars": 112881,
"oov_ratio": 0.06327335832930217,
"_oov_charset": "[\"İ\", \"➔\", \" \", \"N\", \"G\", \"à\", \"☺\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"x\", \"Ø\", \"😀\", \"“\", \"😦\", \"y\", \"X\", \"û\", \"H\", \"å\", \"’\", \"ó\", \"I\", \"h\", \"\", \"č\", \"á\", \"…\", \"â\", \"”\", \"R\", \"ç\", \"Ã\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"ú\", \"\", \"�\", \"ń\", \"≠\", \"ί\", \"̈\", \"🙂\", \"E\", \"😂\", \"↩\", \"f\", \"U\", \"—\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"A\", \"😈\", \"K\", \"L\", \"é\", \"–\", \"k\", \"❤\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"ü\", \"s\", \"😆\", \"\", \"‘\", \"ā\", \"😢\", \"´\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"g\", \"J\", \"\", \"š\", \"B\", \"P\", \"`\", \"p\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"n\", \"Z\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/en": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1124813,
"_n_tokens": 271691,
"_n_chars": 1121360,
"_n_oov_chars": 32702,
"oov_ratio": 0.029162802311478917,
"_oov_charset": "[\"V\", \"U\", \"I\", \"—\", \"S\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"…\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"”\", \"é\", \"‑\", \"R\", \"–\", \"B\", \"P\", \"“\", \"Q\", \"😉\", \"X\", \"ï\", \"H\", \"\", \"😥\", \"F\", \"C\", \"‘\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"Z\", \"´\", \"’\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/es": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1664455,
"_n_tokens": 385564,
"_n_chars": 1630297,
"_n_oov_chars": 70460,
"oov_ratio": 0.04321911897034712,
"_oov_charset": "[\"✓\", \"V\", \"М\", \"U\", \"I\", \"—\", \"v\", \"É\", \"ý\", \"Á\", \"S\", \"\", \"á\", \"T\", \"N\", \"G\", \"à\", \"W\", \"️\", \"Y\", \"…\", \"ö\", \"í\", \"M\", \"è\", \"A\", \"D\", \"z\", \"K\", \"J\", \"L\", \"”\", \"é\", \"R\", \"–\", \"\", \"▷\", \"P\", \"B\", \"😀\", \"Í\", \"❤\", \"\", \"“\", \"😦\", \"Q\", \"😉\", \"ò\", \"ü\", \"X\", \"🙁\", \"👍\", \"H\", \"\", \"ñ\", \"C\", \"F\", \"Ñ\", \"‘\", \"✪\", \"ú\", \"✔\", \"\", \"―\", \"Ú\", \"👏\", \"´\", \"Z\", \"’\", \"ô\", \"O\", \"Ó\", \"🙂\", \"✖\", \"ó\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/fa": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2054052,
"_n_tokens": 398911,
"_n_chars": 1145876,
"_n_oov_chars": 18383,
"oov_ratio": 0.016042748080944184,
"_oov_charset": "[\"ٌ\", \"ٔ\", \"V\", \"ِ\", \"U\", \"I\", \"ً\", \"✿\", \"S\", \"\", \"W\", \"T\", \"N\", \"G\", \"️\", \"\", \"…\", \"ؤ\", \"Y\", \"أ\", \"M\", \"\", \"♥\", \"ن\", \"A\", \"D\", \"K\", \"J\", \"إ\", \"”\", \"ئ\", \"L\", \"▐\", \"R\", \"–\", \"\", \"\", \"B\", \"P\", \"◄\", \"❤\", \"“\", \"َ\", \"ڪ\", \"Q\", \"د\", \"آ\", \"X\", \"ٍ\", \"H\", \"\", \"ُ\", \"F\", \"C\", \"ۀ\", \"‘\", \"ّ\", \"\", \"�\", \"ּ\", \"Z\", \"ْ\", \"’\", \"O\", \"★\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/fr": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1540504,
"_n_tokens": 379266,
"_n_chars": 1484970,
"_n_oov_chars": 73935,
"oov_ratio": 0.049788884623931794,
"_oov_charset": "[\"V\", \"U\", \"I\", \"—\", \"h\", \"É\", \"̂\", \"S\", \"N\", \"T\", \"W\", \"G\", \"à\", \"Â\", \"Y\", \"…\", \"Î\", \"í\", \"è\", \"ù\", \"M\", \"A\", \"À\", \"D\", \"â\", \"K\", \"J\", \"ğ\", \"L\", \"”\", \"é\", \"́\", \"̧\", \"R\", \"–\", \"\", \"ç\", \"P\", \"B\", \"ë\", \"❤\", \"😀\", \"î\", \"“\", \"Q\", \"😉\", \"ã\", \"ü\", \"Ê\", \"ï\", \"X\", \"‐\", \"û\", \"🤔\", \"H\", \"\", \"F\", \"ê\", \"C\", \"‘\", \"
\", \"Ô\", \"ä\", \"È\", \"�\", \"―\", \"Z\", \"´\", \"’\", \"ô\", \"O\", \"Ç\", \"🙂\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ja": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1774770,
"_n_tokens": 466785,
"_n_chars": 603065,
"_n_oov_chars": 52691,
"oov_ratio": 0.08737200799250495,
"_oov_charset": "[\"y\", \"ー\", \"あ\", \"ペ\", \"お\", \"ら\", \"げ\", \"つ\", \"タ\", \"N\", \"ア\", \"G\", \"W\", \"C\", \"を\", \"M\", \"L\", \"め\", \"∀\", \"D\", \"✨\", \"ベ\", \"ぞ\", \"び\", \"ハ\", \"よ\", \"フ\", \"M\", \"に\", \"Q\", \"“\", \"゙\", \"๑\", \"ぴ\", \"た\", \"し\", \"\", \"X\", \"I\", \"H\", \"ゞ\", \"欝\", \"け\", \"Ⅱ\", \"く\", \"K\", \"じ\", \"⑩\", \"😭\", \"カ\", \"Ⅶ\", \"ゃ\", \"’\", \"R\", \"り\", \"そ\", \"と\", \"ジ\", \"😊\", \"I\", \"レ\", \"が\", \"ゴ\", \"V\", \"て\", \"Z\", \"…\", \"纒\", \"¥\", \"ゾ\", \"⑪\", \"🌙\", \"”\", \"ゎ\", \"フ\", \"R\", \"ぼ\", \"か\", \"▷\", \"ち\", \"ボ\", \"G\", \"ズ\", \"▽\", \"こ\", \"D\", \"ぎ\", \"\", \"リ\", \"え\", \"F\", \"ゥ\", \"う\", \"‐\", \"ビ\", \"プ\", \"\\u001b\", \"︎\", \"ま\", \"ざ\", \"F\", \"C\", \"O\", \"E\", \"😌\", \"ロ\", \"Ⅹ\", \"�\", \"P\", \"=\", \"ぷ\", \"̈\", \"E\", \"ポ\", \"゚\", \"ド\", \"U\", \"ゼ\", \"—\", \"ッ\", \"す\", \"H\", \"S\", \"U\", \"ブ\", \"W\", \"T\", \"○\", \"ヨ\", \"Y\", \"ぜ\", \"و\", \"A\", \"Y\", \"ギ\", \"K\", \"ぱ\", \"L\", \"́\", \"ず\", \"ン\", \"な\", \"–\", \"A\", \"❤\", \"\\b\", \"⻑\", \"き\", \"ぐ\", \"💦\", \"べ\", \"Q\", \"れ\", \"ヴ\", \"J\", \"モ\", \"丿\", \"コ\", \" \", \"ど\", \"づ\", \"ヽ\", \"\", \"ぶ\", \"だ\", \"い\", \"B\", \"ス\", \"̀\", \"☆\", \"バ\", \"😢\", \"$\", \"´\", \"゙\", \"⌒\", \"ぽ\", \"グ\", \"●\", \"O\", \"T\", \"ゲ\", \"瘻\", \"ヾ\", \"V\", \"ィ\", \"ご\", \"メ\", \"リ\", \"の\", \"⑧\", \"ピ\", \"わ\", \"パ\", \"ね\", \"S\", \"゚\", \"ガ\", \"J\", \"`\", \" ̄\", \"レ\", \"も\", \"ん\", \"♫\", \"b\", \"B\", \"P\", \"^\", \"X\", \"`\", \"Д\", \"で\", \"テ\", \"デ\", \"さ\", \"っ\", \"1\", \"ダ\", \"―\", \"ザ\", \"ト\", \"✧\", \"ノ\", \"Z\", \"ヘ\", \"ウ\", \"ー\", \"ば\", \"N\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/ko": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 1524839,
"_n_tokens": 538172,
"_n_chars": 655190,
"_n_oov_chars": 441027,
"oov_ratio": 0.6731284055006944,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"갈\", \"싱\", \"체\", \"D\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"👏\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"깥\", \"둠\", \"햇\", \"폴\", \"진\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"쫒\", \"◈\", \"촉\", \"욥\", \"텀\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"롯\", \"뿔\", \"셌\", \"꽤\", \"봉\", \"촨\", \"퀸\", \"룩\", \"줏\", \"뽀\", \"여\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"뢰\", \"너\", \"😂\", \"별\", \"똑\", \"행\", \"걱\", \"겟\", \"하\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"깅\", \"ㅚ\", \"텐\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"⑵\", \"땅\", \"\", \"길\", \"칼\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"훈\", \"삐\", \"퍙\", \"루\", \"붐\", \"女\", \"젠\", \"뻐\", \"궐\", \"숙\", \"〮\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"툼\", \"F\", \"컸\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"른\", \"머\", \"수\", \"액\", \"꿈\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"쿤\", \"존\", \"말\", \"옌\", \"보\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"갤\", \"랄\", \"둑\", \"춥\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"➊\", \"훅\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"눌\", \"낮\", \"왓\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"⬇\", \"멕\", \"↕\", \"않\", \"츈\", \"텁\", \"피\", \"읊\", \"명\", \"뿜\", \"흑\", \"딘\", \"W\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"녁\", \"♤\", \"텨\", \"치\", \"벙\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"ㅙ\", \"홋\", \"겪\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"옮\", \"람\", \"핫\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"쇄\", \"각\", \"뭔\", \"쭉\", \"껀\", \"훔\", \"맬\", \"🦅\", \"쪄\", \"션\", \"히\", \"벚\", \"’\", \"즙\", \"뺀\", \"쳤\", \"a\", \"준\", \"I\", \"얏\", \"겔\", \"확\", \"꾀\", \"잴\", \"똘\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"방\", \"반\", \"S\", \"옥\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"텍\", \"폼\", \"선\", \"붉\", \"樂\", \"쎈\", \"겠\", \"골\", \"얀\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"케\", \"멜\", \"🤗\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"코\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"옳\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"퓨\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"돗\", \"곡\", \"핍\", \"옆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"클\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"챔\", \"탰\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"급\", \"누\", \"밟\", \"셰\", \"맷\", \"💥\", \"N\", \"렷\", \"렘\", \"령\", \"트\", \"💰\", \"윗\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"타\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"즈\", \"킥\", \"C\", \"문\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"볶\", \"씌\", \"8\", \"끝\", \"살\", \"웖\", \"👍\", \"바\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"깝\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"슨\", \"었\", \"샐\", \"팬\", \"팅\", \"높\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"쥰\", \"잘\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"압\", \"언\", \"자\", \"널\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"년\", \"잃\", \"볍\", \"큼\", \"휩\", \"훠\", \"밌\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"훨\", \"걸\", \"돠\", \"🌵\", \"서\", \"숭\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"얄\", \"앰\", \"림\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"흄\", \"릅\", \"💣\", \"촬\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"듬\", \"친\", \"냉\", \"힙\", \"팽\", \"헝\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"3\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"톤\", \"절\", \"씹\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"넌\", \"임\", \"ㅔ\", \"런\", \"즐\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"몸\", \"쥬\", \"—\", \"둔\", \"졸\", \"에\", \"젤\", \"톨\", \"냈\", \"푸\", \"배\", \"앤\", \"재\", \"책\", \"‘\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"챗\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"識\", \"믐\", \"n\", \"㉰\", \"본\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"M\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"H\", \"제\", \"⚀\", \"ㅝ\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"견\", \"ᴍ\", \"최\", \"꼴\", \"듈\", \"뜸\", \"탐\", \"미\", \"상\", \"짱\", \"분\", \"건\", \"▷\", \"싣\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"🙆\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"🙌\", \"B\", \"P\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"환\", \"렐\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"퉁\", \"웃\", \"그\", \"렴\", \"생\", \"대\", \"융\", \"묵\", \"”\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"족\", \"닥\", \"힜\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"뗀\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"곧\", \"힌\", \"빚\", \"덜\", \"썹\", \"엘\", \"곱\", \"난\", \"Q\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"⑴\", \"겐\", \"썸\", \"낯\", \"당\", \"닛\", \"쎄\", \"밥\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"꿕\", \"6\", \"납\", \"므\", \"릉\", \"텅\", \"우\", \"켐\", \"펠\", \"“\", \"랐\", \"습\", \"강\", \"뛸\", \"색\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"뱀\", \"조\", \"틔\", \"넹\", \"끙\", \"뚫\", \"뼈\", \"꼬\", \"농\", \"네\", \"쬐\", \"낙\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"💡\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"계\", \"캠\", \"톡\", \"깡\", \"힐\", \"셜\", \"뚝\", \"옴\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"링\", \"끊\", \"혀\", \"웅\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"셉\", \"첸\", \"꼈\", \"전\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"앓\", \"램\", \"💸\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"빠\", \"튬\", \"쩔\", \"숫\", \"죤\", \"툭\", \"흠\", \"검\", \"둥\", \"헌\", \"봅\", \"췄\", \"엠\", \"닉\", \"님\", \"맹\", \"륙\", \"굉\", \"ᴀ\", \"놔\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"👨\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"섞\", \"쑥\", \"엡\", \"뜻\", \"탄\", \"동\", \"잣\", \"챙\", \"㉣\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"웬\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"였\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"짊\", \"㏊\", \"젊\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"큰\", \"폿\", \"옐\", \"징\", \"L\", \"흔\", \"옹\", \"–\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"不\", \"🙇\", \"게\", \"탬\", \"숨\", \"축\", \"충\", \"낼\", \"렛\", \"랑\", \"냄\", \"🌳\", \"약\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"잡\", \"류\", \"향\", \"빵\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"챨\", \"노\", \"율\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"촘\", \"Ⅹ\", \"팟\", \"펙\", \"띤\", \"회\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"땐\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"았\", \"키\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"엄\", \"험\", \"촌\", \"씽\", \"팡\", \"균\", \"🏫\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"모\", \"️\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"삼\", \"착\", \"웍\", \"쌉\", \"믄\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"龍\", \"팍\", \"곁\", \"품\", \"얼\", \"륜\", \"🤟\", \"뿍\", \"홍\", \"쉴\", \"멈\", \"ʟ\", \"슈\", \"못\", \"컴\", \"파\", \"갭\", \"잎\", \"컵\", \"찾\", \"낳\", \"마\", \"탁\", \"주\", \"담\", \"는\", \"폰\", \"띠\", \"속\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google-bert/bert-base-multilingual-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-multilingual-uncased",
"organization": "Google",
"vocab_size": 105879,
"_n_bytes": 2633047,
"_n_tokens": 878021,
"_n_chars": 927311,
"_n_oov_chars": 34294,
"oov_ratio": 0.03698219906805807,
"_oov_charset": "[\"瞟\", \"篓\", \"撸\", \"缈\", \"镏\", \"饨\", \"搀\", \"猡\", \"ㄓ\", \"\", \"擤\", \" \", \"瞠\", \"N\", \"锲\", \"G\", \"à\", \"噼\", \"惬\", \"缥\", \"⒀\", \"C\", \"M\", \"D\", \"攥\", \"擀\", \"屣\", \"Ø\", \"牖\", \"擞\", \"馁\", \"裆\", \"馄\", \"“\", \"踱\", \"觑\", \"诶\", \"嘣\", \"X\", \"骛\", \"倨\", \"樯\", \"H\", \"汩\", \"眯\", \"馕\", \"摞\", \"懑\", \"⑩\", \"\", \"吆\", \"嘤\", \"踌\", \"’\", \"蹿\", \"ě\", \"呸\", \"疴\", \"狞\", \"苒\", \"剐\", \"锒\", \"I\", \"⑶\", \"铄\", \"啕\", \"旆\", \"á\", \"ὐ\", \"V\", \"扪\", \"鹜\", \"…\", \"抠\", \"茏\", \"佝\", \"旖\", \"韪\", \"”\", \"瞅\", \"R\", \"ç\", \"臊\", \"旎\", \"忑\", \"⒁\", \"î\", \"⑷\", \"犟\", \"ズ\", \"D\", \"婊\", \"沏\", \"忪\", \"\", \"遢\", \"谆\", \"\", \"屄\", \"蹩\", \"墒\", \"F\", \"C\", \"龇\", \"偌\", \"跚\", \"瑑\", \"�\", \"掂\", \"⑸\", \"搂\", \"聒\", \"\", \"挎\", \"唏\", \"E\", \"咦\", \"臃\", \"U\", \"惴\", \"\\u0000\", \"—\", \"偻\", \"抿\", \"S\", \"诨\", \"W\", \"T\", \"蹭\", \"赅\", \"怵\", \"耩\", \"⒂\", \"纰\", \"Y\", \"阽\", \"A\", \"⑨\", \"啐\", \"K\", \"L\", \"é\", \"喽\", \"\\u0005\", \"溘\", \"璎\", \"–\", \"瑥\", \"A\", \"\", \"\\b\", \"蓦\", \"⑿\", \"ό\", \"Q\", \"烊\", \"吭\", \"\\u0006\", \"嗦\", \"哧\", \"馍\", \"傥\", \" \", \"N\", \"屉\", \"\", \"颧\", \"锏\", \"‘\", \"ê\", \"搡\", \"愣\", \"惦\", \"\", \"O\", \"T\", \"憋\", \"铩\", \"鸩\", \"V\", \"黢\", \"旳\", \"倏\", \"邋\", \"偎\", \"鼾\", \"拎\", \"挲\", \"唉\", \"忐\", \"⒌\", \"⑴\", \"瑒\", \"炝\", \"飕\", \"⒃\", \"粼\", \"ù\", \"狰\", \"怔\", \"J\", \"黧\", \"遛\", \"嘭\", \"P\", \"B\", \"癜\", \"蹒\", \"`\", \"纨\", \"瑧\", \"黩\", \"⒋\", \"岣\", \"馋\", \"绉\", \"篢\", \"唠\", \"欸\", \"舀\", \"皑\", \"1\", \"饽\", \"盹\", \"嘀\", \"撅\", \"\\u0007\", \"―\", \"捂\", \"瑨\", \"Z\", \"∶\", \"拧\", \"逶\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/ar": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2813283,
"_n_tokens": 1249370,
"_n_chars": 1560987,
"_n_oov_chars": 71627,
"oov_ratio": 0.045885712052694864,
"_oov_charset": "[\"م\", \"۲\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"G\", \"à\", \"ب\", \"M\", \"\", \"D\", \"إ\", \"ذ\", \"😀\", \"ۤ\", \"۰\", \"٨\", \"X\", \"▫\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"ٌ\", \"😊\", \"I\", \"█\", \"‹\", \"\", \"⤴\", \"ۚ\", \"â\", \"٪\", \"ئ\", \"ۗ\", \"R\", \"ۖ\", \"َ\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ح\", \"ί\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"S\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"A\", \"K\", \"L\", \"é\", \"\", \"Х\", \"﴿\", \"؛\", \"Q\", \"٠\", \"؟\", \"\", \"ُ\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"V\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"ﻷ\", \"ؤ\", \"أ\", \"J\", \"٤\", \"B\", \"P\", \"ή\", \"ä\", \"ّ\", \"ث\", \"Z\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/de": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1814876,
"_n_tokens": 626485,
"_n_chars": 1784021,
"_n_oov_chars": 110980,
"oov_ratio": 0.062207787912810446,
"_oov_charset": "[\"İ\", \"➔\", \" \", \"N\", \"G\", \"à\", \"☺\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"Ø\", \"😀\", \"😦\", \"X\", \"û\", \"H\", \"å\", \"ó\", \"I\", \"\", \"‹\", \"č\", \"á\", \"▼\", \"â\", \"R\", \"ç\", \"Ã\", \"😉\", \"ï\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"ú\", \"\", \"�\", \"ń\", \"≠\", \"ί\", \"̈\", \"🙂\", \"♡\", \"E\", \"😂\", \"↩\", \"U\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"A\", \"😈\", \"K\", \"L\", \"é\", \"k\", \"❤\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"ü\", \"😆\", \"\", \"ā\", \"😢\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"J\", \"\", \"š\", \"B\", \"P\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"Z\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/en": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1124813,
"_n_tokens": 260575,
"_n_chars": 1121360,
"_n_oov_chars": 31075,
"oov_ratio": 0.027711885567525147,
"_oov_charset": "[\"V\", \"U\", \"I\", \"③\", \"S\", \"⑧\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"M\", \"è\", \"⑦\", \"A\", \"D\", \"K\", \"J\", \"L\", \"é\", \"R\", \"P\", \"B\", \"Q\", \"😉\", \"X\", \"ï\", \"H\", \"\", \"😥\", \"F\", \"C\", \"⑤\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"Z\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/es": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1664455,
"_n_tokens": 538042,
"_n_chars": 1630297,
"_n_oov_chars": 68333,
"oov_ratio": 0.041914448717012914,
"_oov_charset": "[\"✓\", \"V\", \"М\", \"U\", \"I\", \"É\", \"ý\", \"Á\", \"S\", \"\", \"á\", \"N\", \"T\", \"G\", \"à\", \"W\", \"️\", \"Y\", \"ö\", \"í\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"é\", \"R\", \"\", \"▷\", \"P\", \"B\", \"😀\", \"Í\", \"❤\", \"\", \"😦\", \"Q\", \"😉\", \"ò\", \"ü\", \"X\", \"🙁\", \"👍\", \"H\", \"\", \"ñ\", \"C\", \"F\", \"Ñ\", \"✪\", \"ú\", \"✔\", \"\", \"Ú\", \"👏\", \"Z\", \"ô\", \"O\", \"Ó\", \"🙂\", \"✖\", \"ó\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/fa": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2054052,
"_n_tokens": 890783,
"_n_chars": 1145876,
"_n_oov_chars": 24082,
"oov_ratio": 0.021016235613626606,
"_oov_charset": "[\"م\", \" \", \"۲\", \"N\", \"G\", \"ب\", \"M\", \"\", \"ط\", \"ق\", \"D\", \"إ\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"I\", \"ج\", \"✿\", \"۳\", \"️\", \"\", \"♥\", \"ن\", \"ا\", \"پ\", \"ئ\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"٢\", \"�\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"5\", \"A\", \"K\", \"L\", \"t\", \"k\", \"\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"O\", \"ٍ\", \"V\", \"۷\", \"ش\", \"٣\", \"س\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"گ\", \"۴\", \"ّ\", \"ص\", \"ּ\", \"n\", \"Z\", \"4\", \"ر\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/fr": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1540504,
"_n_tokens": 484075,
"_n_chars": 1484970,
"_n_oov_chars": 66759,
"oov_ratio": 0.04495646376694479,
"_oov_charset": "[\"V\", \"U\", \"I\", \"É\", \"̂\", \"S\", \"N\", \"T\", \"W\", \"G\", \"à\", \"Â\", \"Y\", \"Î\", \"í\", \"è\", \"ù\", \"M\", \"A\", \"À\", \"D\", \"â\", \"K\", \"J\", \"℃\", \"L\", \"ğ\", \"é\", \"́\", \"̧\", \"R\", \"\", \"ç\", \"P\", \"B\", \"ë\", \"❤\", \"😀\", \"î\", \"Q\", \"😉\", \"ã\", \"ü\", \"Ê\", \"ï\", \"X\", \"û\", \"🤔\", \"H\", \"♕\", \"\", \"F\", \"ê\", \"C\", \"
\", \"Ô\", \"ä\", \"È\", \"�\", \"Z\", \"ô\", \"O\", \"Ç\", \"🙂\", \"E\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/ja": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1774770,
"_n_tokens": 560634,
"_n_chars": 603065,
"_n_oov_chars": 182595,
"oov_ratio": 0.3027783074792933,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"G\", \"又\", \"族\", \"C\", \"多\", \"婆\", \"D\", \"ラ\", \"ぃ\", \"✨\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"服\", \"腎\", \"皿\", \"態\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"箭\", \"喜\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"紹\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"布\", \"杏\", \"歓\", \"撮\", \"網\", \"郷\", \"タ\", \"閉\", \"教\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"貧\", \"余\", \"派\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"靴\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"問\", \"旦\", \"副\", \"1\", \"核\", \"幼\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"艦\", \"麓\", \"v\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"完\", \"限\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"憤\", \"プ\", \"讐\", \"F\", \"令\", \"嫁\", \"頷\", \"盤\", \"術\", \"純\", \"薙\", \"遠\", \"標\", \"算\", \"店\", \"則\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"K\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"傘\", \"ヒ\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"詐\", \"u\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"r\", \"索\", \"啓\", \"垠\", \"窪\", \"〆\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"匡\", \"h\", \"浄\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"ヶ\", \"設\", \"幕\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"W\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"c\", \"l\", \"凱\", \"疇\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"J\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"e\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"庁\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"著\", \"エ\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"a\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"I\", \"潟\", \"壊\", \"m\", \"恒\", \"傾\", \"巨\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"銃\", \"閣\", \"衷\", \"点\", \"S\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"´\", \"鋲\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"支\", \"乏\", \"佇\", \"攻\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"4\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"勘\", \"兎\", \"爾\", \"ㅂ\", \"を\", \"還\", \"規\", \"ム\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"汗\", \"黄\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"U\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"o\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"ス\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"蛇\", \"ハ\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"茨\", \"N\", \"途\", \"纏\", \"他\", \"お\", \"云\", \"農\", \"N\", \"赦\", \"要\", \"弁\", \"貸\", \"脇\", \"矢\", \"任\", \"ぴ\", \"愕\", \"漫\", \"\", \"拷\", \"飾\", \"慮\", \"糖\", \"貌\", \"郵\", \"鎖\", \"カ\", \"該\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"写\", \"ゆ\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"C\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"唇\", \"伏\", \"姥\", \"営\", \"E\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"革\", \"8\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"唱\", \"再\", \"桁\", \"😭\", \"Ⅶ\", \"ア\", \"数\", \"滝\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"掃\", \"極\", \"胚\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"被\", \"痴\", \"塵\", \"U\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"A\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"品\", \"練\", \"詞\", \"ふ\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"3\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"ァ\", \"針\", \"資\", \"丁\", \"腫\", \"激\", \"臆\", \"須\", \"泥\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"栽\", \"引\", \"暦\", \"来\", \"ズ\", \"蒙\", \"倍\", \"球\", \"瓦\", \"舞\", \"歪\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"呂\", \"斧\", \"才\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"洒\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"侵\", \"客\", \"移\", \"結\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"O\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"助\", \"丼\", \"ダ\", \"n\", \"賛\", \"背\", \"預\", \"顔\", \"工\", \"朗\", \"炉\", \"賭\", \"蠍\", \"9\", \"M\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"倫\", \"稀\", \"散\", \"H\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"略\", \"ケ\", \"呆\", \"課\", \"悶\", \"料\", \"先\", \"浴\", \"恰\", \"墜\", \"7\", \"纒\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"ゥ\", \"哀\", \"尽\", \"ま\", \"割\", \"且\", \"状\", \"沸\", \"仲\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"腔\", \"末\", \"電\", \"煮\", \"採\", \"重\", \"施\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"B\", \"P\", \"^\", \"遥\", \"税\", \"句\", \"睦\", \"丘\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"懸\", \"提\", \"昇\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"ノ\", \"策\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"低\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"じ\", \"捏\", \"漏\", \"烈\", \"■\", \"磨\", \"弥\", \"忙\", \"應\", \"桑\", \"摩\", \"慈\", \"崔\", \"挫\", \"勉\", \"ワ\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"z\", \"幣\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"Q\", \"報\", \"況\", \"J\", \"s\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"2\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"指\", \"能\", \"6\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"署\", \"摘\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"i\", \"循\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"菊\", \"頓\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"b\", \"窒\", \"至\", \"綬\", \"鼓\", \"亭\", \"揉\", \"ホ\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"狩\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"詩\", \"0\", \"傷\", \"曹\", \"や\", \"箇\", \"園\", \"瞑\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"執\", \"楓\", \"w\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"槃\", \"射\", \"嶽\", \"允\", \"綜\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"に\", \"鹿\", \"豪\", \"捕\", \"X\", \"逆\", \"吹\", \"絞\", \"騰\", \"礁\", \"甚\", \"婚\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"澪\", \"筋\", \"情\", \"典\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"次\", \"ガ\", \"[\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"Z\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"篤\", \"逸\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"T\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"5\", \"編\", \"郭\", \"腹\", \"L\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"贅\", \"随\", \"捺\", \"ト\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"ャ\", \"娠\", \"烙\", \"Y\", \"鞄\", \"締\", \"e\", \"最\", \"簡\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \"V\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"〟\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"啜\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"叫\", \"株\", \"丸\", \"蝶\", \"俳\", \"荘\", \"条\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"R\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"m\", \"措\", \"謬\", \"洩\", \"獄\", \"黙\", \"厚\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"用\", \"拶\", \"ウ\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"頬\", \"邸\", \"瑞\", \"」\", \"t\", \"尋\", \"尺\", \"果\", \"景\", \"k\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"在\", \"煩\", \"榴\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"販\", \"訃\", \"裂\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/ko": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1524839,
"_n_tokens": 884756,
"_n_chars": 655190,
"_n_oov_chars": 440135,
"oov_ratio": 0.671766968360323,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"族\", \"갈\", \"싱\", \"체\", \"多\", \"D\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"罰\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"甲\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"F\", \"컸\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"l\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"a\", \"孝\", \"敬\", \"준\", \"I\", \"얏\", \"겔\", \"m\", \"확\", \"꾀\", \"잴\", \"똘\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"S\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"途\", \"戊\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"C\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"8\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"被\", \"얄\", \"앰\", \"림\", \"蚩\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"씹\", \"資\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"푸\", \"客\", \"結\", \"배\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"H\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"哀\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"생\", \"摩\", \"대\", \"융\", \"묵\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"Q\", \"劫\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"6\", \"常\", \"납\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"i\", \"侯\", \"강\", \"뛸\", \"색\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"好\", \"韜\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"섞\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"員\", \"짊\", \"㏊\", \"젊\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"L\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"對\", \"삼\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"」\", \"t\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"는\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google-bert/bert-base-uncased @ cc100/zh-Hans": {
"tokenizer": "bert-base-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2633047,
"_n_tokens": 878554,
"_n_chars": 927311,
"_n_oov_chars": 573826,
"oov_ratio": 0.6188064198526708,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"G\", \"又\", \"鱼\", \"族\", \"⒀\", \"C\", \"撬\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"D\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"狸\", \"页\", \"挈\", \"吆\", \"\", \"贵\", \"噌\", \"贱\", \"杆\", \"汐\", \"浙\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"氰\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"培\", \"近\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"【\", \"杭\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"偿\", \"衬\", \"撐\", \"靴\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"1\", \"笃\", \"核\", \"找\", \"闻\", \"幼\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"麓\", \"栖\", \"瞠\", \"葆\", \"潭\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"陵\", \"睐\", \"戳\", \"完\", \"戾\", \"限\", \"冯\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"裙\", \"陈\", \"~\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"锥\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \"F\", \"令\", \"嫁\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"嫂\", \"店\", \"书\", \"跃\", \"耙\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"K\", \"痊\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"骰\", \"捧\", \"体\", \"疼\", \"邻\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"梦\", \"沾\", \"增\", \"渠\", \"饰\", \"Ø\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"ὐ\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"冰\", \"蜴\", \"甜\", \"炙\", \"幕\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"W\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"蟀\", \"馍\", \"咐\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"锅\", \"勃\", \"样\", \"卷\", \"幅\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"J\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"廉\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"I\", \"乒\", \"莘\", \"螃\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"嗨\", \"D\", \"衷\", \"点\", \"S\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"苛\", \"刊\", \"佘\", \"础\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"蹒\", \"读\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"4\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"笛\", \"较\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"嘤\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"骸\", \"严\", \"颉\", \"睑\", \"骏\", \"与\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"莓\", \"偶\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"U\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"煎\", \"颖\", \"九\", \"ê\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"ù\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"N\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"呦\", \"估\", \"值\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"厮\", \"枉\", \"纷\", \"婶\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"写\", \"补\", \"夕\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"C\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"E\", \"辈\", \"绽\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"8\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"é\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"價\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"娄\", \"预\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"瀚\", \"矶\", \"璃\", \"利\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"涕\", \"葩\", \"掠\", \"靛\", \"付\", \"豚\", \"为\", \"昊\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"摞\", \"霸\", \"唱\", \"再\", \"蟋\", \"郴\", \"徇\", \"异\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"á\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"阜\", \"列\", \"珊\", \"麾\", \"被\", \"稍\", \"痴\", \"阂\", \"裔\", \"胀\", \"论\", \"首\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"A\", \"洗\", \"纹\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"品\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"瘀\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"蹴\", \"3\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"激\", \"臆\", \"泥\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"锤\", \"引\", \"袍\", \"来\", \"畑\", \"忿\", \"讪\", \"疵\", \"ズ\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"動\", \"赞\", \"斧\", \"才\", \"翅\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"洒\", \"绞\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"龚\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"O\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"助\", \"扣\", \"锂\", \"捂\", \"芬\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"梵\", \"9\", \"攸\", \"岑\", \"涉\", \"晰\", \"刚\", \"蝉\", \"M\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"H\", \"硕\", \"篷\", \"玉\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"漠\", \"哒\", \"畜\", \"伫\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"呆\", \"柳\", \"料\", \"虽\", \"先\", \"浴\", \"鄯\", \"俨\", \"恰\", \"镉\", \"欢\", \"殉\", \"办\", \"臂\", \"惟\", \"7\", \"扼\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"î\", \"遂\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"状\", \"沸\", \"仲\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"偎\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"施\", \"载\", \"炸\", \"匾\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"P\", \"莴\", \"B\", \"税\", \"遥\", \"犀\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"舆\", \"肃\", \"谬\", \"提\", \"军\", \"撞\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"瑨\", \"策\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"帜\", \"弈\", \"低\", \"动\", \"奸\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"喧\", \"泛\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"挫\", \"饷\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"后\", \"蠢\", \"锐\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"Q\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"指\", \"能\", \"沧\", \"6\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \"檀\", \"血\", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"必\", \"均\", \"无\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"踱\", \"峨\", \"茄\", \"仕\", \"庄\", \"急\", \"浆\", \"舶\", \"桓\", \"进\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"辩\", \"柠\", \"朔\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"疹\", \"评\", \"好\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"择\", \"勇\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"战\", \"岁\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"亭\", \"鼓\", \"舰\", \"诫\", \"伉\", \"揉\", \"曾\", \"旷\", \"茂\", \"皙\", \"\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"蚀\", \"狩\", \"聂\", \"啪\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"唉\", \"0\", \"剔\", \"曹\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"X\", \"咖\", \"薯\", \"逆\", \"传\", \"吹\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"ě\", \"莫\", \"婚\", \"鹑\", \"迭\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"Z\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"T\", \"印\", \"○\", \"迩\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"5\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"腹\", \"L\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"阎\", \"憋\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"奥\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"奖\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"ç\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"雳\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"Y\", \"绰\", \"苏\", \"e\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \"V\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"溉\", \"摹\", \"拆\", \"瞪\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"啜\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"à\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"邂\", \"膜\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"峻\", \"眯\", \"晨\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"R\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"搜\", \"芙\", \"厚\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"邸\", \"膳\", \"对\", \"测\", \"瑞\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"擂\", \"何\", \"遮\", \"ό\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"马\", \"裂\", \"瀛\", \"皑\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/ar": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2813283,
"_n_tokens": 558855,
"_n_chars": 1560987,
"_n_oov_chars": 1249848,
"oov_ratio": 0.8006780325524813,
"_oov_charset": "[\"م\", \"©\", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"ذ\", \"😀\", \"خ\", \"×\", \"ۤ\", \"د\", \"۰\", \"٨\", \"τ\", \"▫\", \"\", \"٦\", \"<\", \"
\", \"ْ\", \"}\", \"ٌ\", \"😊\", \"ج\", \"█\", \"¡\", \"‹\", \"\", \"…\", \"ن\", \"♥\", \"χ\", \"{\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"ا\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"^\", \"آ\", \"٩\", \"\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"μ\", \"α\", \"١\", \"و\", \"\", \"Х\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"\\\\\", \"؟\", \"\", \"ُ\", \"~\", \"٥\", \"ﻹ\", \"ـ\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"←\", \"ً\", \"۸\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"٤\", \"ل\", \"ء\", \"ή\", \"″\", \"ص\", \"ّ\", \"ث\", \"η\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/de": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1814876,
"_n_tokens": 470254,
"_n_chars": 1784021,
"_n_oov_chars": 2035,
"oov_ratio": 0.001140681639958274,
"_oov_charset": "[\"©\", \"u\", \"¶\", \"İ\", \"ς\", \"➔\", \" \", \"¿\", \"☺\", \"ć\", \"·\", \"¼\", \"😃\", \"\", \"\", \"Ø\", \"😀\", \"‚\", \"😦\", \"τ\", \"<\", \"å\", \"}\", \"\", \"‹\", \"č\", \"▼\", \"→\", \"…\", \"♥\", \"{\", \"−\", \"œ\", \"ε\", \"Ã\", \"ρ\", \"^\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"¹\", \"ú\", \"\", \"™\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"★\", \"̈\", \"🙂\", \"♡\", \"😂\", \"↩\", \"§\", \"α\", \"ι\", \"¬\", \"😈\", \"❤\", \"ė\", \"›\", \"🙄\", \"Ö\", \"\\\\\", \"😆\", \"\", \"ø\", \"~\", \"ā\", \"😢\", \"´\", \"ớ\", \"\", \"Á\", \"²\", \"¤\", \"š\", \"`\", \"‽\", \"ư\", \"🙁\", \"↑\", \"♦\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/es": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1664455,
"_n_tokens": 696400,
"_n_chars": 1630297,
"_n_oov_chars": 11598,
"oov_ratio": 0.007114041183906981,
"_oov_charset": "[\"■\", \"✓\", \"М\", \"©\", \"←\", \"¡\", \"ý\", \"Á\", \"\", \"¿\", \"️\", \"→\", \"…\", \"·\", \"í\", \"²\", \"{\", \"▷\", \"😀\", \"❤\", \"Í\", \"\", \"×\", \"^\", \"😦\", \"😉\", \"ò\", \"🙁\", \"👍\", \"\\\\\", \"º\", \"ª\", \"\", \"ø\", \"ñ\", \"Ñ\", \"✪\", \"″\", \"ú\", \"✔\", \"<\", \"\", \"Ú\", \"―\", \"👏\", \"´\", \"}\", \"Ó\", \"🙂\", \"✖\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/fa": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2054052,
"_n_tokens": 483767,
"_n_chars": 1145876,
"_n_oov_chars": 898637,
"oov_ratio": 0.7842358160917935,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"ب\", \"·\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"٨\", \"ۀ\", \"\", \"<\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"}\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"{\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"\", \"❤\", \"ڪ\", \"›\", \"؛\", \"ב\", \"٠\", \"ف\", \"\\\\\", \"؟\", \"\", \"ُ\", \"٥\", \"٫\", \"ـ\", \"●\", \"ٍ\", \"ش\", \"س\", \"۷\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"ل\", \"ء\", \"گ\", \"۴\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/fr": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1540504,
"_n_tokens": 466133,
"_n_chars": 1484970,
"_n_oov_chars": 1615,
"oov_ratio": 0.001087564058533169,
"_oov_charset": "[\"§\", \"←\", \"♠\", \"Â\", \"…\", \"·\", \"í\", \"²\", \"{\", \"À\", \"̧\", \"℃\", \"ğ\", \"́\", \"µ\", \"œ\", \"❤\", \"😀\", \"ë\", \"^\", \"😉\", \"ã\", \"Ê\", \"ï\", \"‐\", \"\\\\\", \"🤔\", \"♕\", \"\", \"Ô\", \"″\", \"
\", \"™\", \"<\", \"~\", \"È\", \"�\", \"―\", \"´\", \"Ç\", \"̂\", \"★\", \"}\", \"🙂\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/ja": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1774770,
"_n_tokens": 41947,
"_n_chars": 603065,
"_n_oov_chars": 585967,
"oov_ratio": 0.9716481639624253,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"又\", \"族\", \"青\", \"C\", \"王\", \"多\", \"婆\", \"✨\", \"ラ\", \"ぃ\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \".\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"竹\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"示\", \"馬\", \"服\", \"腎\", \"皿\", \"態\", \"・\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"…\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"三\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"小\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"代\", \"箭\", \"喜\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"氏\", \"紹\", \"城\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"―\", \"布\", \"杏\", \"歓\", \"撮\", \"部\", \"網\", \"間\", \"郷\", \"車\", \"タ\", \"閉\", \"教\", \"有\", \"八\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"陽\", \"貧\", \"余\", \"派\", \"西\", \"河\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"忠\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"→\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"宣\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"場\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"崎\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"的\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"「\", \"靴\", \"司\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"滝\", \"橋\", \"問\", \"旦\", \"副\", \"核\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"艦\", \"麓\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"秀\", \"完\", \"限\", \"学\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"地\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"行\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"本\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"鈴\", \"憤\", \"プ\", \"讐\", \",\", \"令\", \"嫁\", \"頷\", \"盤\", \"松\", \"術\", \"治\", \"純\", \"薙\", \"遠\", \"国\", \"標\", \"算\", \"民\", \"店\", \"女\", \"則\", \"史\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"曲\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"川\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"ヒ\", \"傘\", \"書\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"耳\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"介\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"?\", \"詐\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"索\", \"戦\", \"啓\", \"垠\", \"窪\", \"〆\", \"十\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"楊\", \"匡\", \"浄\", \"止\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"北\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"文\", \"ヶ\", \"ε\", \"設\", \"^\", \"幕\", \"不\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"秋\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"天\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"μ\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"公\", \"凱\", \"疇\", \"帝\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"光\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"明\", \"庁\", \"藤\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"エ\", \"著\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"道\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"潟\", \"壊\", \"犬\", \"勝\", \"恒\", \"傾\", \"巨\", \"。\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"吉\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"健\", \"銃\", \"閣\", \"衷\", \"点\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"」\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"\\\\\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"岡\", \"´\", \"鋲\", \"永\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"侍\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"男\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"朝\", \"支\", \"乏\", \"佇\", \"攻\", \"戸\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"志\", \"勘\", \"兎\", \"葉\", \"爾\", \"ㅂ\", \"を\", \"還\", \"版\", \"ム\", \"規\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"井\", \"汗\", \"黄\", \"春\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"-\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"四\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"力\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"我\", \"ス\", \"樹\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"伊\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"ハ\", \"蛇\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"家\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"年\", \"茨\", \"N\", \"途\", \"纏\", \"©\", \"他\", \"お\", \"云\", \"農\", \"阿\", \"貴\", \"赦\", \"要\", \"弁\", \"金\", \"貸\", \"雄\", \"脇\", \"矢\", \"任\", \"ぴ\", \"東\", \"愕\", \"漫\", \"\", \"拷\", \"一\", \"飾\", \"慮\", \"糖\", \"宮\", \"貌\", \"郵\", \"谷\", \"鎖\", \"カ\", \"法\", \"該\", \"方\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"幸\", \"ゆ\", \"写\", \"博\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"島\", \"唇\", \"伏\", \"姥\", \"営\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"革\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"和\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"千\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"林\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"清\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"〈\", \"唱\", \"再\", \"<\", \"😭\", \"桁\", \"Ⅶ\", \"ア\", \"子\", \"会\", \"数\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"國\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"原\", \"州\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"安\", \"掃\", \"極\", \"胚\", \"発\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"皇\", \"被\", \"外\", \"痴\", \"塵\", \"U\", \"李\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"~\", \"品\", \"練\", \"詞\", \"ふ\", \"〉\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"坂\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \")\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"成\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"門\", \"ァ\", \"針\", \"資\", \"沢\", \"丁\", \"腫\", \"仁\", \"激\", \"臆\", \"須\", \"泥\", \"立\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"平\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"五\", \"引\", \"暦\", \"来\", \"栽\", \"ズ\", \"蒙\", \"倍\", \"之\", \"球\", \"瓦\", \"舞\", \"歪\", \"堂\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"空\", \"呂\", \"斧\", \"才\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"上\", \"洒\", \"〜\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"香\", \"侵\", \"客\", \"移\", \"結\", \"陳\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"佐\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"信\", \"`\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"夏\", \"助\", \"丼\", \"ダ\", \"区\", \"賛\", \"背\", \"預\", \"顔\", \"同\", \"工\", \"朗\", \"炉\", \"賭\", \"白\", \"蠍\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"倫\", \"稀\", \"散\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"ケ\", \"略\", \"森\", \"課\", \"呆\", \"料\", \"悶\", \"先\", \"浴\", \"恰\", \"墜\", \"新\", \"生\", \"纒\", \"南\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"《\", \"ゥ\", \"哀\", \"尽\", \"出\", \"劉\", \"合\", \"ま\", \"割\", \"且\", \"状\", \"政\", \"仲\", \"沸\", \"∇\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"ω\", \"末\", \"腔\", \"水\", \"電\", \"¥\", \"煮\", \"採\", \"重\", \"施\", \"口\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"税\", \"^\", \"遥\", \"句\", \"睦\", \"丘\", \"山\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"名\", \"懸\", \"提\", \"昇\", \"久\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"宇\", \"策\", \"ノ\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"石\", \"低\", \"相\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"都\", \"奈\", \"じ\", \"捏\", \"漏\", \"烈\", \"■\", \"古\", \"磨\", \"長\", \"⇒\", \"弥\", \"忙\", \"應\", \"桑\", \"龍\", \"摩\", \"慈\", \"崔\", \"挫\", \"英\", \"勉\", \"ワ\", \"↓\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"、\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"幣\", \"見\", \"正\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"報\", \"況\", \"J\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"街\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"火\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"土\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"(\", \"指\", \"能\", \"村\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"後\", \" \", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"食\", \"署\", \"摘\", \"─\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"循\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"御\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"貝\", \"尚\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"木\", \"頓\", \"菊\", \"華\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"社\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"比\", \"窒\", \"至\", \"夫\", \"綬\", \"鼓\", \"亭\", \"ホ\", \"揉\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"軍\", \"内\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"也\", \"狩\", \"歌\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"前\", \"詩\", \"傷\", \"曹\", \"や\", \"》\", \"箇\", \"園\", \"瞑\", \"義\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"保\", \"執\", \"楓\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"武\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"郎\", \"射\", \"嶽\", \"槃\", \"允\", \"綜\", \"瀬\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"宗\", \"に\", \"鹿\", \"豪\", \"捕\", \"逆\", \"郡\", \"日\", \"吹\", \"寺\", \"絞\", \"騰\", \"江\", \"礁\", \"甚\", \"婚\", \"美\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"−\", \"澪\", \"筋\", \"情\", \"典\", \"良\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"省\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"/\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"氷\", \"次\", \"ガ\", \"[\", \"海\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"大\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"定\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"分\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"風\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"元\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"京\", \"逸\", \"篤\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"編\", \"心\", \"腹\", \"郭\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"章\", \"月\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"高\", \"贅\", \"随\", \"捺\", \"ト\", \"加\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"田\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"漢\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"野\", \"ャ\", \"娠\", \"烙\", \"鞄\", \"締\", \"昭\", \"e\", \"簡\", \"最\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"太\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"』\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \":\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"手\", \"〟\", \"世\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"!\", \"啜\", \"人\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"″\", \"叫\", \"株\", \"丸\", \"↑\", \"俳\", \"蝶\", \"条\", \"荘\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"士\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"『\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"花\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"事\", \"宿\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"面\", \"主\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"‐\", \"m\", \"中\", \"措\", \"語\", \"謬\", \"洩\", \"獄\", \"黙\", \"里\", \"厚\", \"★\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"ウ\", \"用\", \"拶\", \"星\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"真\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"仮\", \"二\", \"頬\", \"邸\", \"目\", \"瑞\", \"」\", \"尋\", \"尺\", \"果\", \"景\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"張\", \"在\", \"煩\", \"榴\", \"愛\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"下\", \"販\", \"訃\", \"裂\", \"神\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google-t5/t5-large @ cc100/ko": {
"tokenizer": "t5",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1524839,
"_n_tokens": 334457,
"_n_chars": 655190,
"_n_oov_chars": 433242,
"oov_ratio": 0.6612463560188647,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"빈\", \"族\", \"王\", \"갈\", \"싱\", \"체\", \"多\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"竹\", \"백\", \"\", \"규\", \"德\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"三\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"代\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"城\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"部\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"有\", \"八\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"的\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"「\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"숏\", \"福\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"地\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"行\", \"벽\", \"甲\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"컸\", \"治\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"民\", \"女\", \"뜯\", \"략\", \"史\", \"따\", \"틸\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"川\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"十\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"낮\", \"왓\", \"團\", \"北\", \"갯\", \"틴\", \"채\", \"앎\", \"文\", \"싹\", \"늬\", \"^\", \"둡\", \"不\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"秋\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"天\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"公\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"帝\", \"☆\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"光\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"明\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"道\", \"쳤\", \"孝\", \"敬\", \"준\", \"얏\", \"겔\", \"犬\", \"확\", \"꾀\", \"잴\", \"똘\", \"。\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"±\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"」\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"\\\\\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"永\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"男\", \"朝\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"志\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"春\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"家\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"年\", \"途\", \"©\", \"戊\", \"맷\", \"💥\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"金\", \"貸\", \"꾸\", \"雄\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"一\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"谷\", \"폄\", \"눔\", \"法\", \"方\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"킵\", \"뮤\", \"슬\", \"§\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"和\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"林\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"〈\", \"삣\", \"<\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"子\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"國\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"原\", \"믿\", \"팩\", \"싸\", \"움\", \"安\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"皇\", \"둬\", \"식\", \"被\", \"外\", \"얄\", \"α\", \"앰\", \"림\", \"蚩\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"~\", \"〉\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"仁\", \"놨\", \"됬\", \"立\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"平\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"五\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"之\", \"원\", \"갱\", \"레\", \"堂\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"上\", \"푸\", \"客\", \"結\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"信\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"▲\", \"본\", \"㉰\", \"同\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"白\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"}\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"新\", \"미\", \"生\", \"ⅲ\", \"상\", \"짱\", \"南\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"《\", \"哀\", \"획\", \"뭉\", \"出\", \"젝\", \"合\", \"쩌\", \"탓\", \"페\", \"政\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"ω\", \"🤕\", \"水\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"口\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"🙌\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"山\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"相\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"×\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"古\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"摩\", \"묵\", \"英\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"正\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"劫\", \"뜩\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"火\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"土\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"常\", \"납\", \"後\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"食\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"侯\", \"강\", \"뛸\", \"색\", \"御\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"{\", \"죄\", \"훌\", \"好\", \"韜\", \"華\", \"ㅅ\", \"社\", \"큐\", \"얽\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"뼈\", \"比\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"》\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"武\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"宗\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"🍎\", \"내\", \"日\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"江\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"美\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"海\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"大\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"分\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"京\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"○\", \"큰\", \"폿\", \"옐\", \"징\", \"蟄\", \"心\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"章\", \"月\", \"완\", \"딸\", \"高\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"·\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"し\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"≤\", \"す\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"野\", \"직\", \"답\", \"昭\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"』\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"手\", \"껑\", \"땡\", \"돼\", \"世\", \"돋\", \"져\", \"끌\", \"쏙\", \"랍\", \"락\", \"▣\", \"없\", \"人\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"『\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"事\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"面\", \"主\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"中\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"里\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"星\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"目\", \"」\", \"Ⅸ\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"下\", \"는\", \"神\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google/byt5-small @ cc100/ar": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2813283,
"_n_tokens": 2813283,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/byt5-small @ cc100/de": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1814876,
"_n_tokens": 1814876,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/byt5-small @ cc100/es": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1664455,
"_n_tokens": 1664455,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/byt5-small @ cc100/fa": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 2054052,
"_n_tokens": 2054052,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"google/byt5-small @ cc100/fr": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1540504,
"_n_tokens": 1540504,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/byt5-small @ cc100/ja": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1774770,
"_n_tokens": 1774770,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"google/byt5-small @ cc100/ko": {
"tokenizer": "byt5-small",
"organization": "Google",
"vocab_size": 384,
"_n_bytes": 1524839,
"_n_tokens": 1524839,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"google/gemma-7b @ cc100/ar": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2813283,
"_n_tokens": 563788,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/de": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1814876,
"_n_tokens": 406876,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/en": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1124813,
"_n_tokens": 258010,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/es": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1664455,
"_n_tokens": 361321,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/fa": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2054052,
"_n_tokens": 363762,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/fr": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1540504,
"_n_tokens": 364551,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/ja": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1774770,
"_n_tokens": 307873,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/ko": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 1524839,
"_n_tokens": 454410,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/gemma-7b @ cc100/zh-Hans": {
"tokenizer": "gemma-7b",
"organization": "Google",
"vocab_size": 256000,
"_n_bytes": 2633047,
"_n_tokens": 631795,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"google/mobilebert-uncased @ cc100/ar": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2813283,
"_n_tokens": 1249370,
"_n_chars": 1560987,
"_n_oov_chars": 71627,
"oov_ratio": 0.045885712052694864,
"_oov_charset": "[\"م\", \"۲\", \"ض\", \"ﻻ\", \"N\", \"ٱ\", \"ﷺ\", \"G\", \"à\", \"ب\", \"M\", \"\", \"D\", \"إ\", \"ذ\", \"😀\", \"ۤ\", \"۰\", \"٨\", \"X\", \"▫\", \"H\", \"\", \"٦\", \"
\", \"ْ\", \"ٌ\", \"😊\", \"I\", \"█\", \"‹\", \"\", \"⤴\", \"ۚ\", \"â\", \"٪\", \"ئ\", \"ۗ\", \"R\", \"ۖ\", \"َ\", \"آ\", \"٩\", \"\", \"F\", \"C\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ح\", \"ί\", \"🙂\", \"E\", \"ع\", \"ِ\", \"↩\", \"U\", \"S\", \"W\", \"T\", \"١\", \"Y\", \"ö\", \"و\", \"A\", \"K\", \"L\", \"é\", \"\", \"Х\", \"﴿\", \"؛\", \"Q\", \"٠\", \"؟\", \"\", \"ُ\", \"٥\", \"ﻹ\", \"ـ\", \"O\", \"ٍ\", \"V\", \"٣\", \"۷\", \"٧\", \"ً\", \"۸\", \"ﻷ\", \"ؤ\", \"أ\", \"J\", \"٤\", \"B\", \"P\", \"ή\", \"ä\", \"ّ\", \"ث\", \"Z\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/de": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1814876,
"_n_tokens": 626485,
"_n_chars": 1784021,
"_n_oov_chars": 110980,
"oov_ratio": 0.062207787912810446,
"_oov_charset": "[\"İ\", \"➔\", \" \", \"N\", \"G\", \"à\", \"☺\", \"ć\", \"😃\", \"M\", \"\", \"è\", \"\", \"D\", \"Ø\", \"😀\", \"😦\", \"X\", \"û\", \"H\", \"å\", \"ó\", \"I\", \"\", \"‹\", \"č\", \"á\", \"▼\", \"â\", \"R\", \"ç\", \"Ã\", \"😉\", \"ï\", \"Ÿ\", \"Ä\", \"F\", \"C\", \"ú\", \"\", \"�\", \"ń\", \"≠\", \"ί\", \"̈\", \"🙂\", \"♡\", \"E\", \"😂\", \"↩\", \"U\", \"É\", \"S\", \"W\", \"T\", \"ö\", \"Y\", \"A\", \"😈\", \"K\", \"L\", \"é\", \"k\", \"❤\", \"ė\", \"🙄\", \"Q\", \"Ö\", \"ü\", \"😆\", \"\", \"ā\", \"😢\", \"ô\", \"O\", \"V\", \"ớ\", \"\", \"Á\", \"J\", \"\", \"š\", \"B\", \"P\", \"Ü\", \"‽\", \"ư\", \"🙁\", \"ä\", \"Z\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/en": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1124813,
"_n_tokens": 260575,
"_n_chars": 1121360,
"_n_oov_chars": 31075,
"oov_ratio": 0.027711885567525147,
"_oov_charset": "[\"V\", \"U\", \"I\", \"③\", \"S\", \"⑧\", \"W\", \"T\", \"N\", \"G\", \"\", \"Y\", \"M\", \"è\", \"⑦\", \"A\", \"D\", \"K\", \"J\", \"L\", \"é\", \"R\", \"P\", \"B\", \"Q\", \"😉\", \"X\", \"ï\", \"H\", \"\", \"😥\", \"F\", \"C\", \"⑤\", \"ñ\", \"⑩\", \"\", \"\", \"�\", \"Z\", \"\", \"O\", \"🙂\", \"ó\", \"E\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/es": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1664455,
"_n_tokens": 538042,
"_n_chars": 1630297,
"_n_oov_chars": 68333,
"oov_ratio": 0.041914448717012914,
"_oov_charset": "[\"✓\", \"V\", \"М\", \"U\", \"I\", \"É\", \"ý\", \"Á\", \"S\", \"\", \"á\", \"N\", \"T\", \"G\", \"à\", \"W\", \"️\", \"Y\", \"ö\", \"í\", \"M\", \"è\", \"A\", \"D\", \"K\", \"J\", \"L\", \"é\", \"R\", \"\", \"▷\", \"P\", \"B\", \"😀\", \"Í\", \"❤\", \"\", \"😦\", \"Q\", \"😉\", \"ò\", \"ü\", \"X\", \"🙁\", \"👍\", \"H\", \"\", \"ñ\", \"C\", \"F\", \"Ñ\", \"✪\", \"ú\", \"✔\", \"\", \"Ú\", \"👏\", \"Z\", \"ô\", \"O\", \"Ó\", \"🙂\", \"✖\", \"ó\", \"E\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/fa": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2054052,
"_n_tokens": 890783,
"_n_chars": 1145876,
"_n_oov_chars": 24082,
"oov_ratio": 0.021016235613626606,
"_oov_charset": "[\"م\", \" \", \"۲\", \"N\", \"G\", \"ب\", \"M\", \"\", \"ط\", \"ق\", \"D\", \"إ\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"y\", \"٨\", \"X\", \"i\", \"H\", \"ۀ\", \"\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"a\", \"۶\", \"ٔ\", \"ٌ\", \"I\", \"ج\", \"✿\", \"۳\", \"️\", \"\", \"♥\", \"ن\", \"ا\", \"پ\", \"ئ\", \"٪\", \"R\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"F\", \"C\", \"٢\", \"�\", \"ح\", \"ت\", \"★\", \"ی\", \"E\", \"ع\", \"ِ\", \"U\", \"S\", \"\", \"W\", \"T\", \"١\", \"Y\", \"و\", \"5\", \"A\", \"K\", \"L\", \"t\", \"k\", \"\", \"❤\", \"ڪ\", \"c\", \"؛\", \"Q\", \"l\", \"٠\", \"ف\", \"s\", \"؟\", \"\", \"ُ\", \"2\", \"٥\", \"٫\", \"O\", \"ٍ\", \"V\", \"۷\", \"ش\", \"٣\", \"س\", \"٧\", \"ً\", \"۸\", \"۔\", \"0\", \"ه\", \"ؤ\", \"أ\", \"ز\", \"J\", \"٤\", \"\", \"P\", \"B\", \"p\", \"ل\", \"گ\", \"۴\", \"ّ\", \"ص\", \"ּ\", \"n\", \"Z\", \"4\", \"ر\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/fr": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1540504,
"_n_tokens": 484075,
"_n_chars": 1484970,
"_n_oov_chars": 66759,
"oov_ratio": 0.04495646376694479,
"_oov_charset": "[\"V\", \"U\", \"I\", \"É\", \"̂\", \"S\", \"N\", \"T\", \"W\", \"G\", \"à\", \"Â\", \"Y\", \"Î\", \"í\", \"è\", \"ù\", \"M\", \"A\", \"À\", \"D\", \"â\", \"K\", \"J\", \"℃\", \"L\", \"ğ\", \"é\", \"́\", \"̧\", \"R\", \"\", \"ç\", \"P\", \"B\", \"ë\", \"❤\", \"😀\", \"î\", \"Q\", \"😉\", \"ã\", \"ü\", \"Ê\", \"ï\", \"X\", \"û\", \"🤔\", \"H\", \"♕\", \"\", \"F\", \"ê\", \"C\", \"
\", \"Ô\", \"ä\", \"È\", \"�\", \"Z\", \"ô\", \"O\", \"Ç\", \"🙂\", \"E\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/ja": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1774770,
"_n_tokens": 560634,
"_n_chars": 603065,
"_n_oov_chars": 182595,
"oov_ratio": 0.3027783074792933,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"G\", \"又\", \"族\", \"C\", \"多\", \"婆\", \"D\", \"ラ\", \"ぃ\", \"✨\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"服\", \"腎\", \"皿\", \"態\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"箭\", \"喜\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"紹\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"布\", \"杏\", \"歓\", \"撮\", \"網\", \"郷\", \"タ\", \"閉\", \"教\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"貧\", \"余\", \"派\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"靴\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"問\", \"旦\", \"副\", \"1\", \"核\", \"幼\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"艦\", \"麓\", \"v\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"完\", \"限\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"憤\", \"プ\", \"讐\", \"F\", \"令\", \"嫁\", \"頷\", \"盤\", \"術\", \"純\", \"薙\", \"遠\", \"標\", \"算\", \"店\", \"則\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"K\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"傘\", \"ヒ\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"詐\", \"u\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"r\", \"索\", \"啓\", \"垠\", \"窪\", \"〆\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"匡\", \"h\", \"浄\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"ヶ\", \"設\", \"幕\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"W\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"c\", \"l\", \"凱\", \"疇\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"J\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"e\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"庁\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"著\", \"エ\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"a\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"I\", \"潟\", \"壊\", \"m\", \"恒\", \"傾\", \"巨\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"銃\", \"閣\", \"衷\", \"点\", \"S\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"´\", \"鋲\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"支\", \"乏\", \"佇\", \"攻\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"4\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"勘\", \"兎\", \"爾\", \"ㅂ\", \"を\", \"還\", \"規\", \"ム\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"汗\", \"黄\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"U\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"o\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"ス\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"蛇\", \"ハ\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"茨\", \"N\", \"途\", \"纏\", \"他\", \"お\", \"云\", \"農\", \"N\", \"赦\", \"要\", \"弁\", \"貸\", \"脇\", \"矢\", \"任\", \"ぴ\", \"愕\", \"漫\", \"\", \"拷\", \"飾\", \"慮\", \"糖\", \"貌\", \"郵\", \"鎖\", \"カ\", \"該\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"写\", \"ゆ\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"C\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"唇\", \"伏\", \"姥\", \"営\", \"E\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"革\", \"8\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"唱\", \"再\", \"桁\", \"😭\", \"Ⅶ\", \"ア\", \"数\", \"滝\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"掃\", \"極\", \"胚\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"被\", \"痴\", \"塵\", \"U\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"A\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"品\", \"練\", \"詞\", \"ふ\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"3\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"ァ\", \"針\", \"資\", \"丁\", \"腫\", \"激\", \"臆\", \"須\", \"泥\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"栽\", \"引\", \"暦\", \"来\", \"ズ\", \"蒙\", \"倍\", \"球\", \"瓦\", \"舞\", \"歪\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"呂\", \"斧\", \"才\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"洒\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"侵\", \"客\", \"移\", \"結\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"O\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"助\", \"丼\", \"ダ\", \"n\", \"賛\", \"背\", \"預\", \"顔\", \"工\", \"朗\", \"炉\", \"賭\", \"蠍\", \"9\", \"M\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"倫\", \"稀\", \"散\", \"H\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"略\", \"ケ\", \"呆\", \"課\", \"悶\", \"料\", \"先\", \"浴\", \"恰\", \"墜\", \"7\", \"纒\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"ゥ\", \"哀\", \"尽\", \"ま\", \"割\", \"且\", \"状\", \"沸\", \"仲\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"腔\", \"末\", \"電\", \"煮\", \"採\", \"重\", \"施\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"B\", \"P\", \"^\", \"遥\", \"税\", \"句\", \"睦\", \"丘\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"懸\", \"提\", \"昇\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"ノ\", \"策\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"低\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"じ\", \"捏\", \"漏\", \"烈\", \"■\", \"磨\", \"弥\", \"忙\", \"應\", \"桑\", \"摩\", \"慈\", \"崔\", \"挫\", \"勉\", \"ワ\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"z\", \"幣\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"Q\", \"報\", \"況\", \"J\", \"s\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"2\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"指\", \"能\", \"6\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"署\", \"摘\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"i\", \"循\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"菊\", \"頓\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"b\", \"窒\", \"至\", \"綬\", \"鼓\", \"亭\", \"揉\", \"ホ\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"狩\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"詩\", \"0\", \"傷\", \"曹\", \"や\", \"箇\", \"園\", \"瞑\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"執\", \"楓\", \"w\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"槃\", \"射\", \"嶽\", \"允\", \"綜\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"に\", \"鹿\", \"豪\", \"捕\", \"X\", \"逆\", \"吹\", \"絞\", \"騰\", \"礁\", \"甚\", \"婚\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"澪\", \"筋\", \"情\", \"典\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"次\", \"ガ\", \"[\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"Z\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"篤\", \"逸\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"T\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"5\", \"編\", \"郭\", \"腹\", \"L\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"贅\", \"随\", \"捺\", \"ト\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"ャ\", \"娠\", \"烙\", \"Y\", \"鞄\", \"締\", \"e\", \"最\", \"簡\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \"V\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"〟\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"啜\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"叫\", \"株\", \"丸\", \"蝶\", \"俳\", \"荘\", \"条\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"R\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"m\", \"措\", \"謬\", \"洩\", \"獄\", \"黙\", \"厚\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"用\", \"拶\", \"ウ\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"頬\", \"邸\", \"瑞\", \"」\", \"t\", \"尋\", \"尺\", \"果\", \"景\", \"k\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"在\", \"煩\", \"榴\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"販\", \"訃\", \"裂\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/ko": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 1524839,
"_n_tokens": 884756,
"_n_chars": 655190,
"_n_oov_chars": 440135,
"oov_ratio": 0.671766968360323,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"G\", \"빈\", \"族\", \"갈\", \"싱\", \"체\", \"多\", \"D\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"백\", \"\", \"규\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"월\", \"罰\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"g\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"픈\", \"딥\", \"먼\", \"심\", \"굶\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"1\", \"숏\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"v\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"벽\", \"甲\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"F\", \"컸\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"뜯\", \"략\", \"틸\", \"따\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"K\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"p\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"u\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"r\", \"릿\", \"쨌\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"h\", \"낮\", \"왓\", \"團\", \"갯\", \"틴\", \"채\", \"앎\", \"싹\", \"늬\", \"둡\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"穀\", \"츈\", \"텁\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"W\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"l\", \"왼\", \"㉿\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"J\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"e\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"쳤\", \"a\", \"孝\", \"敬\", \"준\", \"I\", \"얏\", \"겔\", \"m\", \"확\", \"꾀\", \"잴\", \"똘\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"S\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"4\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"U\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"o\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"途\", \"戊\", \"맷\", \"💥\", \"N\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"貸\", \"꾸\", \"뎅\", \"좋\", \"찔\", \"쩍\", \"․\", \"타\", \"飾\", \"몽\", \"빕\", \"접\", \"폄\", \"눔\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"C\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"E\", \"킵\", \"뮤\", \"슬\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"8\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"d\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"삣\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"믿\", \"팩\", \"싸\", \"움\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"둬\", \"식\", \"被\", \"얄\", \"앰\", \"림\", \"蚩\", \"A\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"3\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"씹\", \"資\", \"논\", \"빤\", \"놨\", \"됬\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"원\", \"갱\", \"레\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"푸\", \"客\", \"結\", \"배\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"O\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"ㅞ\", \"앨\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"n\", \"▲\", \"본\", \"㉰\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"9\", \"M\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"H\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"미\", \"ⅲ\", \"7\", \"상\", \"짱\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"哀\", \"획\", \"뭉\", \"젝\", \"쩌\", \"탓\", \"페\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"🤕\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"B\", \"P\", \"온\", \"🙌\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"젖\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"생\", \"摩\", \"대\", \"융\", \"묵\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"Q\", \"劫\", \"뜩\", \"s\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"2\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"6\", \"常\", \"납\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"i\", \"侯\", \"강\", \"뛸\", \"색\", \"쌈\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"죄\", \"훌\", \"好\", \"韜\", \"ㅅ\", \"얽\", \"큐\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"뚫\", \"b\", \"뼈\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"쏟\", \"처\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"0\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"X\", \"🍎\", \"내\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"섞\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"Z\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"員\", \"짊\", \"㏊\", \"젊\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"T\", \"○\", \"큰\", \"폿\", \"옐\", \"5\", \"징\", \"蟄\", \"L\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"완\", \"딸\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"ç\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"직\", \"Y\", \"답\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \"댓\", \"V\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"껑\", \"땡\", \"돼\", \"돋\", \"져\", \"끌\", \"쏙\", \"\", \"랍\", \"락\", \"▣\", \"없\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"R\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"쿡\", \"캉\", \"對\", \"삼\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"」\", \"t\", \"Ⅸ\", \"k\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"는\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google/mobilebert-uncased @ cc100/zh-Hans": {
"tokenizer": "mobilebert-uncased",
"organization": "Google",
"vocab_size": 30522,
"_n_bytes": 2633047,
"_n_tokens": 878554,
"_n_chars": 927311,
"_n_oov_chars": 573826,
"oov_ratio": 0.6188064198526708,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"G\", \"又\", \"鱼\", \"族\", \"⒀\", \"C\", \"撬\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"D\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"狸\", \"页\", \"挈\", \"吆\", \"\", \"贵\", \"噌\", \"贱\", \"杆\", \"汐\", \"浙\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"氰\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"培\", \"近\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"【\", \"杭\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"偿\", \"衬\", \"撐\", \"靴\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"1\", \"笃\", \"核\", \"找\", \"闻\", \"幼\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"麓\", \"栖\", \"瞠\", \"葆\", \"潭\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"陵\", \"睐\", \"戳\", \"完\", \"戾\", \"限\", \"冯\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"裙\", \"陈\", \"~\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"锥\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \"F\", \"令\", \"嫁\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"嫂\", \"店\", \"书\", \"跃\", \"耙\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"K\", \"痊\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"骰\", \"捧\", \"体\", \"疼\", \"邻\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"梦\", \"沾\", \"增\", \"渠\", \"饰\", \"Ø\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"ὐ\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"冰\", \"蜴\", \"甜\", \"炙\", \"幕\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"W\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"蟀\", \"馍\", \"咐\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"锅\", \"勃\", \"样\", \"卷\", \"幅\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"J\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"廉\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"I\", \"乒\", \"莘\", \"螃\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"嗨\", \"D\", \"衷\", \"点\", \"S\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"苛\", \"刊\", \"佘\", \"础\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"蹒\", \"读\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"4\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"笛\", \"较\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"嘤\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"骸\", \"严\", \"颉\", \"睑\", \"骏\", \"与\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"莓\", \"偶\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"U\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"煎\", \"颖\", \"九\", \"ê\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"ù\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"N\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"呦\", \"估\", \"值\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"厮\", \"枉\", \"纷\", \"婶\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"写\", \"补\", \"夕\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"C\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"E\", \"辈\", \"绽\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"8\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"é\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"價\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"娄\", \"预\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"瀚\", \"矶\", \"璃\", \"利\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"涕\", \"葩\", \"掠\", \"靛\", \"付\", \"豚\", \"为\", \"昊\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"摞\", \"霸\", \"唱\", \"再\", \"蟋\", \"郴\", \"徇\", \"异\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"á\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"阜\", \"列\", \"珊\", \"麾\", \"被\", \"稍\", \"痴\", \"阂\", \"裔\", \"胀\", \"论\", \"首\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"A\", \"洗\", \"纹\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"品\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"瘀\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"蹴\", \"3\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"激\", \"臆\", \"泥\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"锤\", \"引\", \"袍\", \"来\", \"畑\", \"忿\", \"讪\", \"疵\", \"ズ\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"動\", \"赞\", \"斧\", \"才\", \"翅\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"洒\", \"绞\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"龚\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"O\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"助\", \"扣\", \"锂\", \"捂\", \"芬\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"梵\", \"9\", \"攸\", \"岑\", \"涉\", \"晰\", \"刚\", \"蝉\", \"M\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"H\", \"硕\", \"篷\", \"玉\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"漠\", \"哒\", \"畜\", \"伫\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"呆\", \"柳\", \"料\", \"虽\", \"先\", \"浴\", \"鄯\", \"俨\", \"恰\", \"镉\", \"欢\", \"殉\", \"办\", \"臂\", \"惟\", \"7\", \"扼\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"î\", \"遂\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"状\", \"沸\", \"仲\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"偎\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"施\", \"载\", \"炸\", \"匾\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"P\", \"莴\", \"B\", \"税\", \"遥\", \"犀\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"舆\", \"肃\", \"谬\", \"提\", \"军\", \"撞\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"瑨\", \"策\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"帜\", \"弈\", \"低\", \"动\", \"奸\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"喧\", \"泛\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"挫\", \"饷\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"后\", \"蠢\", \"锐\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"Q\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"指\", \"能\", \"沧\", \"6\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \"檀\", \"血\", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"必\", \"均\", \"无\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"踱\", \"峨\", \"茄\", \"仕\", \"庄\", \"急\", \"浆\", \"舶\", \"桓\", \"进\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"辩\", \"柠\", \"朔\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"疹\", \"评\", \"好\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"择\", \"勇\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"战\", \"岁\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"亭\", \"鼓\", \"舰\", \"诫\", \"伉\", \"揉\", \"曾\", \"旷\", \"茂\", \"皙\", \"\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"蚀\", \"狩\", \"聂\", \"啪\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"唉\", \"0\", \"剔\", \"曹\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"X\", \"咖\", \"薯\", \"逆\", \"传\", \"吹\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"ě\", \"莫\", \"婚\", \"鹑\", \"迭\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"Z\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"T\", \"印\", \"○\", \"迩\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"5\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"腹\", \"L\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"阎\", \"憋\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"奥\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"奖\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"ç\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"雳\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"Y\", \"绰\", \"苏\", \"e\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \"V\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"溉\", \"摹\", \"拆\", \"瞪\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"啜\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"à\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"邂\", \"膜\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"峻\", \"眯\", \"晨\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"R\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"搜\", \"芙\", \"厚\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"邸\", \"膳\", \"对\", \"测\", \"瑞\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"擂\", \"何\", \"遮\", \"ό\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"马\", \"裂\", \"瀛\", \"皑\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"google/mt5-large @ cc100/ar": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2813283,
"_n_tokens": 621736,
"_n_chars": 1560987,
"_n_oov_chars": 767,
"oov_ratio": 0.0004913557896382225,
"_oov_charset": "[\"\", \"…\", \"″\", \"\", \"\", \"�\", \"
\", \"½\", \"ﻹ\", \"ﻻ\", \"ﷺ\", \"\", \"\", \"ﻷ\"]",
"reversible": false
},
"google/mt5-large @ cc100/de": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1814876,
"_n_tokens": 470418,
"_n_chars": 1784021,
"_n_oov_chars": 524,
"oov_ratio": 0.0002937185156452755,
"_oov_charset": "[\"…\", \"¼\", \"²\", \"u\", \"\", \"¹\", \"™\", \"�\", \"½\", \"´\", \" \", \"̈\", \"\"]",
"reversible": false
},
"google/mt5-large @ cc100/es": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1664455,
"_n_tokens": 462231,
"_n_chars": 1630297,
"_n_oov_chars": 552,
"oov_ratio": 0.0003385886129950555,
"_oov_charset": "[\"…\", \"″\", \"²\", \"\", \"´\", \"º\", \"ª\"]",
"reversible": false
},
"google/mt5-large @ cc100/fa": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 2054052,
"_n_tokens": 419922,
"_n_chars": 1145876,
"_n_oov_chars": 7690,
"oov_ratio": 0.006711022833186139,
"_oov_charset": "[\"\", \"…\", \"\", \"\", \" \", \"�\", \"ﮧ\", \"\", \"\", \"\"]",
"reversible": false
},
"google/mt5-large @ cc100/fr": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1540504,
"_n_tokens": 460944,
"_n_chars": 1484970,
"_n_oov_chars": 870,
"oov_ratio": 0.0005858704216246792,
"_oov_charset": "[\"…\", \"″\", \"²\", \"™\", \"�\", \"̧\", \"℃\", \"´\", \"́\", \"µ\", \"̂\"]",
"reversible": false
},
"google/mt5-large @ cc100/ja": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1774770,
"_n_tokens": 290542,
"_n_chars": 603065,
"_n_oov_chars": 6762,
"oov_ratio": 0.011212721680084236,
"_oov_charset": "[\"y\", \"a\", \"ー\", \"]\", \" \", \"③\", \"5\", \"n\", \"*\", \"9\", \"ア\", \"W\", \"f\", \"@\", \"C\", \"ㅂ\", \"L\", \"ハ\", \"フ\", \"M\", \"Q\", \".\", \"゙\", \"④\", \"I\", \"Ⅱ\", \"⑩\", \"K\", \"カ\", \"Ⅶ\", \"t\", \"R\", \"g\", \"<\", \"-\", \"V\", \"4\", \"Z\", \"…\", \"¥\", \"纒\", \"⑪\", \"℃\", \"①\", \"o\", \"d\", \"G\", \"D\", \"F\", \"ゥ\", \">\", \"7\", \"\\u001b\", \"m\", \",\", \"O\", \"E\", \"ロ\", \"Ⅹ\", \"�\", \"h\", \"・\", \"②\", \"P\", \"=\", \"ウ\", \"r\", \"3\", \"゚\", \"H\", \"U\", \"+\", \"ヨ\", \"\\", \"e\", \"Y\", \"8\", \"。\", \"」\", \"&\", \"A\", \"⻑\", \"\\b\", \"‼\", \"㎞\", \"「\", \"_\", \"J\", \"2\", \"コ\", \"‥\", \" \", \"\", \"B\", \"$\", \"´\", \"T\", \"l\", \":\", \"0\", \"ィ\", \"%\", \"|\", \"w\", \"/\", \"メ\", \"リ\", \"⑧\", \"S\", \"[\", \"`\", \" ̄\", \"レ\", \"i\", \"b\", \"^\", \"X\", \"!\", \")\", \"6\", \";\", \"テ\", \"″\", \"1\", \"(\", \"s\", \"ノ\", \"ヘ\", \"、\", \"k\", \"N\", \"?\"]",
"reversible": false
},
"google/mt5-large @ cc100/ko": {
"tokenizer": "mt5-large",
"organization": "Google",
"vocab_size": 250100,
"_n_bytes": 1524839,
"_n_tokens": 424586,
"_n_chars": 655190,
"_n_oov_chars": 1365,
"oov_ratio": 0.0020833651307254385,
"_oov_charset": "[\"ⓒ\", \"③\", \"女\", \"*\", \"ㄷ\", \"@\", \"\", \"ㅜ\", \"ㅐ\", \"〮\", \"Ⅷ\", \"ㅛ\", \"④\", \"킌\", \"․\", \"ㅝ\", \"삣\", \"Ⅱ\", \"ㄹ\", \"\", \"➏\", \"Ⅶ\", \"㏊\", \"힉\", \"Ⅵ\", \"⑶\", \"㎍\", \"ㅡ\", \"ㅖ\", \"…\", \"ⅲ\", \"ㅏ\", \"ㅔ\", \"ㅇ\", \"℃\", \"ㅅ\", \"챨\", \"①\", \"ㄴ\", \"ㅣ\", \"Ⅰ\", \"힜\", \"¹\", \"ㅁ\", \"ⅳ\", \"Ⅹ\", \"�\", \"②\", \"⑸\", \"璣\", \"츈\", \"ⓔ\", \"㉠\", \"ㄱ\", \"ㆍ\", \"\", \"ㅢ\", \"퍙\", \"ㅈ\", \"ㅋ\", \"㎡\", \"ㅑ\", \"梁\", \"쒀\", \"⑨\", \"ㅓ\", \"靈\", \"」\", \"Ⅸ\", \"ㅕ\", \"陸\", \"렜\", \"쓕\", \"⁴\", \"㎞\", \"ㅊ\", \"「\", \"龍\", \"ㅚ\", \"웖\", \"뾱\", \"㉿\", \"‥\", \" \", \"樂\", \"流\", \"\", \"v\", \"⑤\", \"ㅍ\", \"理\", \"왘\", \"ㅆ\", \"쫗\", \"ㅘ\", \":\", \"⑹\", \"%\", \"|\", \"⑥\", \"金\", \"㈜\", \"ㅗ\", \"⑧\", \"ㅒ\", \"⑴\", \"不\", \"²\", \"폍\", \"뭥\", \"⑦\", \"ⅱ\", \"ⅰ\", \"綃\", \"ㅞ\", \"累\", \"⑵\", \"ㅠ\", \"ㅙ\", \"立\", \"Ⅲ\", \"㉣\", \"Ⅴ\", \"흗\", \"ㅎ\", \"\", \"㎥\", \"識\", \"Ⅳ\", \"s\", \"꿕\", \"樂\", \"㉰\", \"ㅟ\", \"良\", \"?\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/ar": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2813283,
"_n_tokens": 558855,
"_n_chars": 1560987,
"_n_oov_chars": 1249848,
"oov_ratio": 0.8006780325524813,
"_oov_charset": "[\"م\", \"©\", \"۲\", \"κ\", \"ض\", \"ﻻ\", \"ٱ\", \"ﷺ\", \"ب\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"ذ\", \"😀\", \"خ\", \"×\", \"ۤ\", \"د\", \"۰\", \"٨\", \"τ\", \"▫\", \"\", \"٦\", \"<\", \"
\", \"ْ\", \"}\", \"ٌ\", \"😊\", \"ج\", \"█\", \"¡\", \"‹\", \"\", \"…\", \"ن\", \"♥\", \"χ\", \"{\", \"⤴\", \"ۚ\", \"ة\", \"چ\", \"ا\", \"ھ\", \"٪\", \"ئ\", \"پ\", \"ۗ\", \"ٹ\", \"ۖ\", \"ک\", \"ρ\", \"َ\", \"ي\", \"^\", \"آ\", \"٩\", \"\", \"ك\", \"٢\", \"ٰ\", \"�\", \"﴾\", \"ظ\", \"½\", \"ح\", \"ί\", \"ت\", \"ی\", \"🙂\", \"ع\", \"ِ\", \"↩\", \"μ\", \"α\", \"١\", \"و\", \"\", \"Х\", \"﴿\", \"›\", \"؛\", \"٠\", \"ف\", \"\\\\\", \"؟\", \"\", \"ُ\", \"~\", \"٥\", \"ﻹ\", \"ـ\", \"ٍ\", \"▪\", \"ش\", \"س\", \"٣\", \"۷\", \"٧\", \"←\", \"ً\", \"۸\", \"ه\", \"ﻷ\", \"ؤ\", \"أ\", \"ز\", \"٤\", \"ل\", \"ء\", \"ή\", \"″\", \"ص\", \"ّ\", \"ث\", \"η\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/de": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1814876,
"_n_tokens": 470254,
"_n_chars": 1784021,
"_n_oov_chars": 2035,
"oov_ratio": 0.001140681639958274,
"_oov_charset": "[\"©\", \"u\", \"¶\", \"İ\", \"ς\", \"➔\", \" \", \"¿\", \"☺\", \"ć\", \"·\", \"¼\", \"😃\", \"\", \"\", \"Ø\", \"😀\", \"‚\", \"😦\", \"τ\", \"<\", \"å\", \"}\", \"\", \"‹\", \"č\", \"▼\", \"→\", \"…\", \"♥\", \"{\", \"−\", \"œ\", \"ε\", \"Ã\", \"ρ\", \"^\", \"😉\", \"ï\", \"‐\", \"Ÿ\", \"Ä\", \"¹\", \"ú\", \"\", \"™\", \"�\", \"ń\", \"½\", \"≠\", \"ί\", \"★\", \"̈\", \"🙂\", \"♡\", \"😂\", \"↩\", \"§\", \"α\", \"ι\", \"¬\", \"😈\", \"❤\", \"ė\", \"›\", \"🙄\", \"Ö\", \"\\\\\", \"😆\", \"\", \"ø\", \"~\", \"ā\", \"😢\", \"´\", \"ớ\", \"\", \"Á\", \"²\", \"¤\", \"š\", \"`\", \"‽\", \"ư\", \"🙁\", \"↑\", \"♦\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/en": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1124813,
"_n_tokens": 280104,
"_n_chars": 1121360,
"_n_oov_chars": 136,
"oov_ratio": 0.00012128130127702077,
"_oov_charset": "[\"③\", \"¡\", \"⑧\", \"¦\", \"\", \"…\", \"{\", \"⑦\", \"‑\", \"^\", \"😉\", \"ï\", \"😥\", \"\", \"⑤\", \"ñ\", \"⑩\", \"<\", \"~\", \"\", \"\", \"�\", \"´\", \"\", \"}\", \"🙂\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/es": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1664455,
"_n_tokens": 696400,
"_n_chars": 1630297,
"_n_oov_chars": 11598,
"oov_ratio": 0.007114041183906981,
"_oov_charset": "[\"■\", \"✓\", \"М\", \"©\", \"←\", \"¡\", \"ý\", \"Á\", \"\", \"¿\", \"️\", \"→\", \"…\", \"·\", \"í\", \"²\", \"{\", \"▷\", \"😀\", \"❤\", \"Í\", \"\", \"×\", \"^\", \"😦\", \"😉\", \"ò\", \"🙁\", \"👍\", \"\\\\\", \"º\", \"ª\", \"\", \"ø\", \"ñ\", \"Ñ\", \"✪\", \"″\", \"ú\", \"✔\", \"<\", \"\", \"Ú\", \"―\", \"👏\", \"´\", \"}\", \"Ó\", \"🙂\", \"✖\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/fa": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2054052,
"_n_tokens": 483767,
"_n_chars": 1145876,
"_n_oov_chars": 898637,
"oov_ratio": 0.7842358160917935,
"_oov_charset": "[\"م\", \"©\", \" \", \"۲\", \"ض\", \"ب\", \"·\", \"\", \"ق\", \"ط\", \"إ\", \"ى\", \"▐\", \"ذ\", \"خ\", \"×\", \"د\", \"۰\", \"٨\", \"ۀ\", \"\", \"<\", \"ژ\", \"ﮧ\", \"۵\", \"ْ\", \"۹\", \"۱\", \"ٴ\", \"}\", \"۶\", \"ٔ\", \"ٌ\", \"ج\", \"✿\", \"ے\", \"۳\", \"ט\", \"️\", \"\", \"…\", \"ن\", \"♥\", \"{\", \"چ\", \"ة\", \"ا\", \"ھ\", \"پ\", \"ئ\", \"٪\", \"◄\", \"ک\", \"َ\", \"ي\", \"آ\", \"٩\", \"ۆ\", \"ك\", \"٢\", \"�\", \"ظ\", \"ح\", \"ت\", \"★\", \"ی\", \"ع\", \"ِ\", \"\", \"١\", \"و\", \"\", \"❤\", \"ڪ\", \"›\", \"؛\", \"ב\", \"٠\", \"ف\", \"\\\\\", \"؟\", \"\", \"ُ\", \"٥\", \"٫\", \"ـ\", \"●\", \"ٍ\", \"ش\", \"س\", \"۷\", \"٣\", \"٧\", \"ً\", \"۸\", \"۔\", \"ه\", \"ؤ\", \"ز\", \"أ\", \"٤\", \"ل\", \"ء\", \"گ\", \"۴\", \"ص\", \"ّ\", \"ּ\", \"ث\", \"،\", \"غ\", \"ر\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/fr": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1540504,
"_n_tokens": 466133,
"_n_chars": 1484970,
"_n_oov_chars": 1615,
"oov_ratio": 0.001087564058533169,
"_oov_charset": "[\"§\", \"←\", \"♠\", \"Â\", \"…\", \"·\", \"í\", \"²\", \"{\", \"À\", \"̧\", \"℃\", \"ğ\", \"́\", \"µ\", \"œ\", \"❤\", \"😀\", \"ë\", \"^\", \"😉\", \"ã\", \"Ê\", \"ï\", \"‐\", \"\\\\\", \"🤔\", \"♕\", \"\", \"Ô\", \"″\", \"
\", \"™\", \"<\", \"~\", \"È\", \"�\", \"―\", \"´\", \"Ç\", \"̂\", \"★\", \"}\", \"🙂\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/ja": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1774770,
"_n_tokens": 41947,
"_n_chars": 603065,
"_n_oov_chars": 585967,
"oov_ratio": 0.9716481639624253,
"_oov_charset": "[\"蜂\", \"濫\", \"募\", \"茫\", \"惨\", \"慄\", \"又\", \"族\", \"青\", \"C\", \"王\", \"多\", \"婆\", \"✨\", \"ラ\", \"ぃ\", \"声\", \"修\", \"細\", \"よ\", \"廊\", \"膚\", \".\", \"僕\", \"妬\", \"囲\", \"I\", \"欝\", \"眼\", \"赴\", \"竹\", \"K\", \"噌\", \"貿\", \"疾\", \"坊\", \"ぅ\", \"t\", \"示\", \"馬\", \"服\", \"腎\", \"皿\", \"態\", \"・\", \"筈\", \"牲\", \"咽\", \"耶\", \"罰\", \"讃\", \"形\", \"癖\", \"…\", \"徴\", \"洪\", \"¥\", \"考\", \"例\", \"ょ\", \"姿\", \"縮\", \"建\", \"帆\", \"G\", \"緩\", \"認\", \"旋\", \"猿\", \"悟\", \"因\", \"念\", \"円\", \"茶\", \"債\", \"炒\", \"・\", \"卑\", \"返\", \"泄\", \"優\", \"朴\", \"ぉ\", \"三\", \"為\", \"項\", \"退\", \"液\", \"轢\", \"穢\", \"叉\", \"離\", \"薦\", \"小\", \"梁\", \"威\", \"&\", \"怨\", \"壮\", \"未\", \"槌\", \"俄\", \"詠\", \"怪\", \"埃\", \"埋\", \"謗\", \"ど\", \"誌\", \"脚\", \"淡\", \"推\", \"蘇\", \"粧\", \"辱\", \"概\", \"ぽ\", \"殿\", \"労\", \"逐\", \"緑\", \"瘻\", \"拳\", \"マ\", \"縄\", \"姓\", \"|\", \"ご\", \"代\", \"箭\", \"喜\", \"域\", \"S\", \"忌\", \"漂\", \"礫\", \"附\", \"椿\", \"告\", \"了\", \"舌\", \"ぬ\", \"獣\", \"訝\", \"撒\", \"填\", \"氏\", \"紹\", \"城\", \"轄\", \"励\", \"融\", \"堪\", \"斡\", \"媛\", \"貪\", \"豊\", \"―\", \"布\", \"杏\", \"歓\", \"撮\", \"部\", \"網\", \"間\", \"郷\", \"車\", \"タ\", \"閉\", \"教\", \"有\", \"八\", \"括\", \"蒔\", \"促\", \"容\", \"役\", \"吐\", \"酔\", \"姦\", \"M\", \"織\", \"袖\", \"陽\", \"貧\", \"余\", \"派\", \"西\", \"河\", \"梓\", \"険\", \"七\", \"侮\", \"湘\", \"百\", \"錠\", \"桜\", \"祇\", \"件\", \"截\", \"姫\", \"承\", \"洞\", \"準\", \"毛\", \"が\", \"忠\", \"憧\", \"戯\", \"泉\", \"得\", \"厨\", \"接\", \"嫌\", \"→\", \"醐\", \"察\", \"誹\", \"は\", \"①\", \"袈\", \"喇\", \"影\", \"杖\", \"包\", \"緒\", \"庫\", \"D\", \"伸\", \"蓄\", \"屋\", \"え\", \"読\", \"杜\", \"晴\", \"桂\", \"表\", \"旺\", \"魏\", \"努\", \"逡\", \"息\", \"机\", \"娯\", \"邪\", \"払\", \"祥\", \"=\", \"開\", \"題\", \"♡\", \"聾\", \"残\", \"ポ\", \"△\", \"系\", \"宣\", \"銘\", \"托\", \"症\", \"倭\", \"誤\", \"根\", \"遡\", \"飼\", \"制\", \"透\", \"場\", \"ブ\", \"閃\", \"押\", \"虐\", \"酒\", \"跳\", \"隕\", \"詰\", \"膨\", \"近\", \"培\", \"嘲\", \"克\", \"勿\", \"強\", \"砕\", \"崎\", \"渡\", \"闊\", \"童\", \"催\", \"今\", \"倒\", \"的\", \"【\", \"バ\", \"砦\", \"●\", \"隠\", \"沿\", \"脆\", \"慶\", \"骨\", \"凶\", \"「\", \"靴\", \"司\", \"カ\", \"雰\", \"泌\", \"棄\", \"斂\", \"`\", \"扉\", \"従\", \"〔\", \"物\", \"折\", \"享\", \"謀\", \"雅\", \"滝\", \"橋\", \"問\", \"旦\", \"副\", \"核\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"虎\", \"某\", \"即\", \"ろ\", \"ウ\", \"依\", \"ば\", \"艦\", \"麓\", \"療\", \"累\", \"母\", \"脱\", \"5\", \"】\", \"n\", \"座\", \"懐\", \"*\", \"添\", \"岐\", \"陵\", \"遍\", \"及\", \"履\", \"秀\", \"完\", \"限\", \"学\", \"幡\", \"絶\", \"湧\", \"当\", \"び\", \"地\", \"陥\", \"存\", \"๑\", \"渦\", \"嚥\", \"弾\", \"奨\", \"製\", \"縦\", \"県\", \"~\", \"側\", \"担\", \"髭\", \"行\", \"災\", \"恩\", \"<\", \"甲\", \"匂\", \"誇\", \"庭\", \"鐘\", \"メ\", \"本\", \"駅\", \"彙\", \"愉\", \"府\", \"職\", \"巡\", \"旅\", \"墾\", \"醜\", \"売\", \"曖\", \"雪\", \"鈴\", \"憤\", \"プ\", \"讐\", \",\", \"令\", \"嫁\", \"頷\", \"盤\", \"松\", \"術\", \"治\", \"純\", \"薙\", \"遠\", \"国\", \"標\", \"算\", \"民\", \"店\", \"女\", \"則\", \"史\", \"占\", \"等\", \"峠\", \"堀\", \"縫\", \"渉\", \"尊\", \"戴\", \"ぜ\", \"凄\", \"卵\", \"曲\", \"銀\", \"枢\", \"焼\", \"米\", \"㎞\", \"構\", \"雇\", \"膿\", \"川\", \"芸\", \"ヽ\", \"縁\", \"争\", \"泰\", \"だ\", \"縞\", \"堅\", \"拠\", \"ヒ\", \"傘\", \"書\", \"麹\", \"狐\", \"l\", \"灰\", \"嶋\", \"守\", \"映\", \"〝\", \"耳\", \"掲\", \"怠\", \"初\", \"試\", \"垣\", \"致\", \"滋\", \"泳\", \"慨\", \"追\", \"妖\", \"肺\", \"責\", \"伴\", \"剰\", \"督\", \"飛\", \"虫\", \"匠\", \"塾\", \"似\", \"ザ\", \"叶\", \"介\", \"ヘ\", \"蓋\", \"較\", \"捧\", \"体\", \"?\", \"詐\", \"胎\", \"あ\", \"曜\", \"衣\", \"少\", \"庇\", \"頃\", \"遜\", \"官\", \"飢\", \"げ\", \"つ\", \"髪\", \"索\", \"戦\", \"啓\", \"垠\", \"窪\", \"〆\", \"十\", \"濯\", \"釣\", \"た\", \"勢\", \"む\", \"湯\", \"儲\", \"身\", \"充\", \"謎\", \"Ⅱ\", \"旧\", \"翼\", \"箱\", \"草\", \"毒\", \"楊\", \"匡\", \"浄\", \"止\", \"徘\", \"放\", \"ゴ\", \"詳\", \"磯\", \"北\", \"去\", \"汚\", \"琴\", \"舐\", \"賀\", \"窃\", \"ゎ\", \"文\", \"ヶ\", \"ε\", \"設\", \"^\", \"幕\", \"不\", \"煙\", \"澤\", \"妥\", \"﨑\", \"\\u001b\", \"秋\", \"沖\", \"怯\", \"階\", \"械\", \"窮\", \"偽\", \"兼\", \"爆\", \"紛\", \"天\", \"穀\", \"堵\", \"狂\", \"評\", \"軟\", \"尖\", \"μ\", \"ゼ\", \"頼\", \"裏\", \"半\", \"熟\", \"央\", \"業\", \"+\", \"憑\", \"湾\", \"旭\", \"敷\", \"摂\", \"Y\", \"油\", \"幹\", \"票\", \"操\", \"悪\", \"作\", \"A\", \"隆\", \"臓\", \"公\", \"凱\", \"疇\", \"帝\", \"揶\", \"厳\", \"芝\", \"鍵\", \"籠\", \"☆\", \"睡\", \"断\", \"盛\", \"霧\", \"咎\", \"◎\", \"距\", \"芳\", \"継\", \"諏\", \"←\", \"頭\", \"メ\", \"痢\", \"光\", \"幅\", \"滲\", \"遙\", \"浦\", \"匙\", \"笠\", \"障\", \"独\", \"ね\", \"足\", \"総\", \"流\", \"曽\", \"買\", \"股\", \"犯\", \"破\", \"筆\", \"6\", \"ェ\", \"鼻\", \"寝\", \"1\", \"洋\", \"椒\", \"k\", \"ー\", \"宏\", \"灌\", \"a\", \"ー\", \"思\", \"褒\", \"蛍\", \"濡\", \"サ\", \"監\", \"9\", \"戚\", \"f\", \"釘\", \"∀\", \"以\", \"紐\", \"諸\", \"嘗\", \"載\", \"量\", \"匹\", \"杼\", \"如\", \"明\", \"庁\", \"藤\", \"徐\", \"者\", \"昆\", \"屹\", \"特\", \"疎\", \"絡\", \"市\", \"裾\", \"眩\", \"肢\", \"腰\", \"判\", \"エ\", \"著\", \"鉢\", \"搬\", \"撰\", \"硝\", \"噴\", \"悩\", \"聖\", \"字\", \"昏\", \"⑩\", \"投\", \"貰\", \"両\", \"廉\", \"道\", \"嘆\", \"孝\", \"敬\", \"ク\", \"ィ\", \"潟\", \"壊\", \"犬\", \"勝\", \"恒\", \"傾\", \"巨\", \"。\", \"喉\", \"夢\", \"陛\", \"牙\", \"理\", \"d\", \"差\", \"鑑\", \"F\", \"駆\", \">\", \"痕\", \"翻\", \"弊\", \"辛\", \"暁\", \"棚\", \"靄\", \"孤\", \"吉\", \"気\", \"却\", \"耗\", \"幻\", \"共\", \"然\", \"霞\", \"健\", \"銃\", \"閣\", \"衷\", \"点\", \"午\", \"欲\", \"視\", \"穏\", \"匿\", \"亡\", \"知\", \"班\", \"\\", \"毎\", \"و\", \"亮\", \"涙\", \"働\", \"罪\", \"梶\", \"駄\", \"」\", \"隔\", \"夜\", \"韮\", \"圏\", \"淵\", \"べ\", \"丿\", \"意\", \"\\\\\", \"求\", \"鉄\", \"紅\", \"帳\", \"澄\", \"恣\", \"瘍\", \"岡\", \"´\", \"鋲\", \"永\", \"礎\", \"伽\", \"る\", \"ニ\", \"泊\", \"0\", \"秘\", \"キ\", \"刊\", \"苛\", \"侍\", \"揃\", \"の\", \"斐\", \"蛮\", \"暖\", \"爽\", \"位\", \"抑\", \"党\", \"含\", \"訳\", \"超\", \"侶\", \"勲\", \"億\", \"男\", \"需\", \"恨\", \"味\", \"闘\", \"恵\", \"計\", \"朝\", \"支\", \"乏\", \"佇\", \"攻\", \"戸\", \"菜\", \"輪\", \"救\", \"♪\", \"許\", \"伐\", \"落\", \"符\", \"径\", \"舎\", \"夷\", \"疑\", \"魔\", \"崖\", \"④\", \"拙\", \"研\", \"潮\", \"袴\", \"霊\", \"惹\", \"笛\", \"志\", \"勘\", \"兎\", \"葉\", \"爾\", \"ㅂ\", \"を\", \"還\", \"版\", \"ム\", \"規\", \"釜\", \"挟\", \"経\", \"於\", \"軒\", \"虚\", \"待\", \"配\", \"燃\", \"向\", \"可\", \"揄\", \"院\", \"談\", \"辿\", \"垢\", \"宅\", \"井\", \"汗\", \"黄\", \"春\", \"彫\", \"与\", \"捐\", \"鬱\", \"送\", \"基\", \"餌\", \"-\", \"偶\", \"児\", \"遊\", \"▼\", \"鬼\", \"衆\", \"仏\", \"冊\", \"℃\", \"四\", \"焙\", \"盲\", \"皆\", \"罠\", \"自\", \"延\", \"剃\", \"\", \"否\", \"踪\", \"択\", \"7\", \"謡\", \"力\", \"藻\", \"序\", \"�\", \"硬\", \"応\", \"剣\", \"み\", \"属\", \"撲\", \"図\", \"済\", \"捲\", \"鏡\", \"識\", \"奪\", \"奏\", \"躇\", \"ギ\", \"́\", \"委\", \"誰\", \"覆\", \"柄\", \"器\", \"干\", \"⻑\", \"\\b\", \"雀\", \"き\", \"ぐ\", \"潰\", \"れ\", \"ヴ\", \"モ\", \"_\", \"掴\", \"づ\", \"我\", \"ス\", \"樹\", \"煎\", \"九\", \"狭\", \"ゥ\", \"単\", \"膝\", \"😢\", \"⌒\", \"舟\", \"T\", \"伝\", \"伊\", \"綺\", \"通\", \"振\", \"屈\", \"商\", \"ハ\", \"蛇\", \"係\", \"続\", \"飲\", \"柱\", \"俵\", \"ピ\", \"第\", \"家\", \"届\", \"駒\", \"除\", \"捜\", \"順\", \"危\", \"灘\", \"源\", \"改\", \"簿\", \"厄\", \"恥\", \"Д\", \"育\", \"僅\", \"溢\", \"私\", \"擦\", \"祖\", \"就\", \"年\", \"茨\", \"N\", \"途\", \"纏\", \"©\", \"他\", \"お\", \"云\", \"農\", \"阿\", \"貴\", \"赦\", \"要\", \"弁\", \"金\", \"貸\", \"雄\", \"脇\", \"矢\", \"任\", \"ぴ\", \"東\", \"愕\", \"漫\", \"\", \"拷\", \"一\", \"飾\", \"慮\", \"糖\", \"宮\", \"貌\", \"郵\", \"谷\", \"鎖\", \"カ\", \"法\", \"該\", \"方\", \"顕\", \"と\", \"g\", \"😊\", \"遽\", \"曇\", \"涅\", \"将\", \"潜\", \"受\", \"V\", \"麺\", \"快\", \"或\", \"幸\", \"ゆ\", \"写\", \"博\", \"塚\", \"夕\", \"輸\", \"迫\", \"唐\", \"荷\", \"校\", \"喰\", \"欽\", \"▽\", \"団\", \"コ\", \"己\", \"困\", \"珍\", \"抵\", \"鱈\", \"入\", \"拡\", \"交\", \"E\", \"函\", \"律\", \"宝\", \"島\", \"唇\", \"伏\", \"姥\", \"営\", \"躍\", \"3\", \"親\", \"綱\", \"塊\", \"峰\", \"牧\", \"琉\", \"浣\", \"喚\", \"鞘\", \"礼\", \"異\", \"革\", \"欺\", \"捗\", \"丹\", \"領\", \"負\", \"希\", \"昼\", \"集\", \"番\", \"ツ\", \"頑\", \"欠\", \"舘\", \"複\", \"爪\", \"潤\", \"瞳\", \"擬\", \"擢\", \"眉\", \"燥\", \"栃\", \"号\", \"遵\", \"グ\", \"沼\", \"叭\", \"抱\", \"汎\", \"シ\", \"ィ\", \"贋\", \"友\", \"凡\", \"噂\", \"屓\", \"愚\", \"齢\", \"酵\", \"蔓\", \"免\", \"和\", \"暇\", \"周\", \"漱\", \"覇\", \"剥\", \"脂\", \"回\", \"貢\", \"千\", \"奢\", \"組\", \"媒\", \"遅\", \"費\", \"査\", \"チ\", \"菌\", \"裟\", \"林\", \"利\", \"度\", \"弟\", \"韓\", \"s\", \"拘\", \"述\", \"清\", \"餓\", \"敵\", \"連\", \"起\", \"ア\", \"界\", \"@\", \"確\", \"漁\", \"種\", \"範\", \"貯\", \"験\", \"値\", \"淳\", \"゙\", \"込\", \"紀\", \"付\", \"豚\", \"掛\", \"癒\", \"飯\", \"〈\", \"唱\", \"再\", \"<\", \"😭\", \"桁\", \"Ⅶ\", \"ア\", \"子\", \"会\", \"数\", \"節\", \"ネ\", \"抽\", \"避\", \"肯\", \"り\", \"怒\", \"駐\", \"乳\", \"築\", \"札\", \"岸\", \"羽\", \"巷\", \"卒\", \"國\", \"漑\", \"率\", \"観\", \"解\", \"牛\", \"悲\", \"原\", \"州\", \"奔\", \"嬢\", \"刷\", \"嗜\", \"へ\", \"安\", \"掃\", \"極\", \"胚\", \"発\", \"乙\", \"リ\", \"閲\", \"斉\", \"廃\", \"胸\", \"銭\", \"聞\", \"欧\", \"邦\", \"換\", \"◆\", \"奮\", \"挑\", \"廻\", \"鉱\", \"失\", \"各\", \"晶\", \"碓\", \"做\", \"r\", \"瞭\", \"阜\", \"列\", \"皇\", \"被\", \"外\", \"痴\", \"塵\", \"U\", \"李\", \"首\", \"軌\", \"頒\", \"防\", \"痩\", \"洗\", \"8\", \"慰\", \"。\", \"亀\", \"な\", \"露\", \"譲\", \"捉\", \"短\", \"黒\", \"2\", \" \", \"覧\", \"挙\", \"斬\", \"厭\", \"い\", \"祈\", \"把\", \"B\", \"医\", \"囁\", \"這\", \"~\", \"品\", \"練\", \"詞\", \"ふ\", \"〉\", \"壇\", \"樺\", \"辰\", \"傑\", \"閑\", \"盗\", \"菓\", \"早\", \"勤\", \"坂\", \"披\", \"耕\", \"喋\", \"輔\", \"証\", \"訣\", \"溜\", \"琳\", \"⑧\", \"賑\", \"叱\", \"偵\", \"進\", \"凍\", \"牽\", \"β\", \"復\", \"説\", \"補\", \"灯\", \"寧\", \"抹\", \"湖\", \")\", \"荻\", \"底\", \"で\", \"留\", \"暮\", \"さ\", \"隈\", \"現\", \"室\", \"豆\", \"浩\", \"成\", \"具\", \"陰\", \"眠\", \"麦\", \"◡\", \"蹴\", \"妹\", \"活\", \"姑\", \"③\", \"セ\", \"門\", \"ァ\", \"針\", \"資\", \"沢\", \"丁\", \"腫\", \"仁\", \"激\", \"臆\", \"須\", \"泥\", \"立\", \"塗\", \"飽\", \"迷\", \"筒\", \"到\", \"綾\", \"彿\", \"ヲ\", \"対\", \"蔑\", \"肘\", \"穫\", \"刑\", \"羞\", \"平\", \"損\", \"噤\", \"臣\", \"蓮\", \"競\", \"別\", \"誠\", \"画\", \"晒\", \"套\", \"沈\", \"戒\", \"オ\", \"昧\", \"稲\", \"槽\", \"糞\", \"て\", \"湿\", \"角\", \"降\", \"害\", \"🌙\", \"誘\", \"畑\", \"話\", \"臭\", \"五\", \"引\", \"暦\", \"来\", \"栽\", \"ズ\", \"蒙\", \"倍\", \"之\", \"球\", \"瓦\", \"舞\", \"歪\", \"堂\", \"帰\", \"秒\", \"犠\", \"獲\", \"雲\", \"動\", \"空\", \"呂\", \"斧\", \"才\", \"゚\", \"蔽\", \"跨\", \"藁\", \"炭\", \"兵\", \"抜\", \"墓\", \"選\", \"論\", \"批\", \"上\", \"洒\", \"〜\", \"鍋\", \"衰\", \"忘\", \"鳴\", \"ヵ\", \"香\", \"侵\", \"客\", \"移\", \"結\", \"陳\", \"ヘ\", \"枚\", \"疲\", \"帽\", \"コ\", \"幌\", \"娘\", \"栗\", \"診\", \"拒\", \"迅\", \"猟\", \"阪\", \"架\", \"臨\", \"刀\", \"ゲ\", \"測\", \"偏\", \"頻\", \"嵐\", \"%\", \"貨\", \"佐\", \"借\", \"眺\", \"祀\", \"躊\", \"辞\", \"傍\", \"控\", \"慣\", \"パ\", \"嵩\", \"停\", \"乃\", \"反\", \"゚\", \"津\", \"召\", \"置\", \"信\", \"`\", \"耐\", \"収\", \"綴\", \"植\", \"台\", \"陣\", \"週\", \"焦\", \"隊\", \"騒\", \"始\", \"夏\", \"助\", \"丼\", \"ダ\", \"区\", \"賛\", \"背\", \"預\", \"顔\", \"同\", \"工\", \"朗\", \"炉\", \"賭\", \"白\", \"蠍\", \"望\", \"涼\", \"怖\", \"ぞ\", \"杉\", \"転\", \"訊\", \"倫\", \"稀\", \"散\", \"養\", \"玉\", \"漠\", \"凝\", \"肉\", \"難\", \"畜\", \"悠\", \"ゃ\", \"唯\", \"隼\", \"滑\", \"宙\", \"咳\", \"篠\", \"象\", \"扱\", \"緻\", \"参\", \"麻\", \"ケ\", \"略\", \"森\", \"課\", \"呆\", \"料\", \"悶\", \"先\", \"浴\", \"恰\", \"墜\", \"新\", \"生\", \"纒\", \"南\", \"艸\", \"絆\", \"幾\", \"兄\", \"▷\", \"か\", \"殻\", \"ボ\", \"踏\", \"遂\", \"《\", \"ゥ\", \"哀\", \"尽\", \"出\", \"劉\", \"合\", \"ま\", \"割\", \"且\", \"状\", \"政\", \"仲\", \"沸\", \"∇\", \"祠\", \"殆\", \"昔\", \"訓\", \"非\", \"俺\", \"征\", \"運\", \"珠\", \"憩\", \"諾\", \"唸\", \"誉\", \"剤\", \"圧\", \"聴\", \"篇\", \"缶\", \"笑\", \"羨\", \"馳\", \"鉛\", \"畳\", \"馴\", \"麗\", \"俊\", \"濃\", \"滞\", \"テ\", \"尾\", \"誕\", \"型\", \"乱\", \"宛\", \"裸\", \"蛋\", \"゙\", \"房\", \"裕\", \"艶\", \"梱\", \"ω\", \"末\", \"腔\", \"水\", \"電\", \"¥\", \"煮\", \"採\", \"重\", \"施\", \"口\", \"叩\", \"姜\", \"惣\", \"葬\", \"堤\", \"併\", \"狼\", \"升\", \"溶\", \"暑\", \"税\", \"^\", \"遥\", \"句\", \"睦\", \"丘\", \"山\", \"闖\", \"巣\", \";\", \"肝\", \"垂\", \"名\", \"懸\", \"提\", \"昇\", \"久\", \"戻\", \"契\", \"互\", \"削\", \"凛\", \"雑\", \"宇\", \"策\", \"ノ\", \"炎\", \"徨\", \"格\", \"紋\", \"ら\", \"脳\", \"没\", \"闇\", \"軽\", \"悔\", \"船\", \"L\", \"石\", \"低\", \"相\", \"左\", \"譚\", \"討\", \"盾\", \"Q\", \"×\", \"緯\", \"質\", \"腸\", \"矛\", \"頂\", \"喧\", \"癌\", \"都\", \"奈\", \"じ\", \"捏\", \"漏\", \"烈\", \"■\", \"古\", \"磨\", \"長\", \"⇒\", \"弥\", \"忙\", \"應\", \"桑\", \"龍\", \"摩\", \"慈\", \"崔\", \"挫\", \"英\", \"勉\", \"ワ\", \"↓\", \"絵\", \"胆\", \"精\", \"造\", \"贈\", \"酷\", \"、\", \"雨\", \"触\", \"ざ\", \"渋\", \"潔\", \"壌\", \"謙\", \"町\", \"ぷ\", \"統\", \"棒\", \"居\", \"池\", \"舗\", \"償\", \"瞬\", \"梳\", \"倉\", \"H\", \"床\", \"援\", \"媚\", \"俯\", \"楽\", \"秤\", \"直\", \"弓\", \"稼\", \"幣\", \"見\", \"正\", \"替\", \"葵\", \"記\", \"妙\", \"毅\", \"薄\", \"描\", \"椅\", \"装\", \"報\", \"況\", \"J\", \"磋\", \"老\", \"\", \"竜\", \"窟\", \"供\", \"感\", \"苗\", \"詮\", \"徒\", \"枯\", \"飴\", \"街\", \"猛\", \"氾\", \"額\", \"授\", \"圃\", \"わ\", \"寓\", \"創\", \"火\", \"酸\", \" ̄\", \"熱\", \"季\", \"貶\", \"ん\", \"警\", \"鍛\", \"嬉\", \"唄\", \"過\", \"覗\", \"ォ\", \"慎\", \"彼\", \"土\", \"惧\", \"議\", \"俗\", \"寿\", \"撤\", \"琵\", \"看\", \"(\", \"指\", \"能\", \"村\", \"、\", \"常\", \"喝\", \"繰\", \"罵\", \"拍\", \"万\", \"錯\", \"後\", \" \", \"檀\", \"血\", \"肪\", \"奴\", \"涯\", \"必\", \"W\", \"均\", \"食\", \"署\", \"摘\", \"─\", \"妊\", \"繍\", \"脅\", \"懲\", \"路\", \"煽\", \"フ\", \"言\", \"満\", \"峨\", \"仕\", \"摯\", \"急\", \"庄\", \"僭\", \"賠\", \"循\", \"普\", \"駿\", \"浜\", \"肥\", \"陶\", \"兆\", \"御\", \"餅\", \"納\", \"糸\", \"そ\", \"栓\", \"撃\", \"貝\", \"尚\", \"囚\", \"挨\", \"苦\", \"輝\", \"恭\", \"疹\", \"嵌\", \"好\", \"木\", \"頓\", \"菊\", \"華\", \"痛\", \"勇\", \"ほ\", \"温\", \"琶\", \"跡\", \"社\", \"但\", \"只\", \"穂\", \"色\", \"梅\", \"綻\", \"う\", \"々\", \"僧\", \"痒\", \"絨\", \"虹\", \"杞\", \"想\", \"襲\", \"音\", \"専\", \"😌\", \"響\", \"比\", \"窒\", \"至\", \"夫\", \"綬\", \"鼓\", \"亭\", \"ホ\", \"揉\", \"茂\", \"突\", \"腱\", \"滓\", \"是\", \"唆\", \"驚\", \"斗\", \"ヨ\", \"陸\", \"妻\", \"緊\", \"命\", \"誓\", \"軍\", \"内\", \"ぱ\", \"徊\", \"ず\", \"帯\", \"賞\", \"疫\", \"探\", \"逢\", \"也\", \"狩\", \"歌\", \"掻\", \"演\", \"析\", \"ぶ\", \"病\", \"$\", \"吾\", \"悍\", \"喫\", \"墟\", \"祉\", \"ヾ\", \"効\", \"稜\", \"浪\", \"抗\", \"亜\", \"隙\", \"前\", \"詩\", \"傷\", \"曹\", \"や\", \"》\", \"箇\", \"園\", \"瞑\", \"義\", \"護\", \"釈\", \"伯\", \"式\", \"稚\", \"堺\", \"ロ\", \"興\", \"桃\", \"尻\", \"妄\", \"□\", \"板\", \"レ\", \"群\", \"i\", \"混\", \"染\", \"淹\", \"保\", \"執\", \"楓\", \"端\", \"テ\", \"粘\", \"袋\", \"萼\", \"類\", \"刺\", \"胃\", \"梗\", \"遼\", \"減\", \"謄\", \"武\", \"固\", \"玄\", \"材\", \"斜\", \"踊\", \"増\", \"拉\", \"籍\", \"播\", \"ペ\", \"程\", \"禁\", \"郎\", \"射\", \"嶽\", \"槃\", \"允\", \"綜\", \"瀬\", \"祭\", \"め\", \"録\", \"据\", \"ベ\", \"ハ\", \"遭\", \"嗅\", \"瓢\", \"浅\", \"宗\", \"に\", \"鹿\", \"豪\", \"捕\", \"逆\", \"郡\", \"日\", \"吹\", \"寺\", \"絞\", \"騰\", \"江\", \"礁\", \"甚\", \"婚\", \"美\", \"R\", \"喩\", \"迭\", \"莫\", \"斑\", \"導\", \"様\", \"枕\", \"携\", \"嗚\", \"企\", \"腑\", \"乗\", \"撫\", \"梨\", \"凪\", \"梯\", \"−\", \"澪\", \"筋\", \"情\", \"典\", \"良\", \"宜\", \"衝\", \"若\", \"寮\", \"迎\", \"婦\", \"遺\", \"協\", \"壁\", \"坪\", \"遣\", \"砂\", \"打\", \"箋\", \"汰\", \"謳\", \"拭\", \"翔\", \"模\", \"全\", \"ロ\", \"検\", \"②\", \"師\", \"埼\", \"時\", \"糾\", \"楠\", \"財\", \"省\", \"珪\", \"昂\", \"ド\", \"燭\", \"辣\", \"鎮\", \"暢\", \"隅\", \"紙\", \"珂\", \"晩\", \"揚\", \"殊\", \"酬\", \"曝\", \"擁\", \"桟\", \"揮\", \"暫\", \"輩\", \"偉\", \"イ\", \"俸\", \"寡\", \"冷\", \"決\", \"予\", \"「\", \"攫\", \"ゝ\", \"館\", \"渓\", \"嵯\", \"熊\", \"持\", \"究\", \"乞\", \"殴\", \"化\", \"槍\", \"違\", \"候\", \"走\", \"儀\", \"ュ\", \"/\", \"父\", \"期\", \"寒\", \"審\", \"級\", \"氷\", \"次\", \"ガ\", \"[\", \"海\", \"寛\", \"b\", \"臥\", \"広\", \"X\", \"喪\", \"大\", \"衡\", \"取\", \"敗\", \"碌\", \"躾\", \"賃\", \"欣\", \"更\", \"灼\", \"祝\", \"っ\", \"棟\", \"痺\", \"務\", \"沙\", \"✧\", \"展\", \"旗\", \"寇\", \"浮\", \"鶴\", \"]\", \"岳\", \"岬\", \"鮮\", \"塔\", \"琢\", \"彡\", \"鴻\", \"刻\", \"敏\", \"片\", \"胞\", \"鳥\", \"ナ\", \"拾\", \"性\", \"定\", \"科\", \"冬\", \"咲\", \"穴\", \"称\", \"狙\", \"密\", \"握\", \"貫\", \"粗\", \"く\", \"分\", \"横\", \"員\", \"錬\", \"捩\", \"甘\", \"貼\", \"孫\", \"並\", \"ジ\", \"暗\", \"晋\", \"粋\", \"坐\", \"卓\", \"レ\", \"風\", \"懇\", \"腕\", \"嫉\", \"惑\", \"仰\", \"4\", \"Z\", \"窓\", \"諺\", \"寸\", \"達\", \"ゾ\", \"伺\", \"元\", \"呟\", \"個\", \"ぼ\", \"盆\", \"変\", \"翌\", \"繁\", \"峙\", \"漬\", \"掘\", \"ビ\", \"淫\", \"着\", \"案\", \"◇\", \"h\", \"実\", \"呑\", \"P\", \"双\", \"京\", \"逸\", \"篤\", \"賊\", \"杓\", \"冗\", \"挿\", \"訟\", \"肌\", \"滴\", \"印\", \"○\", \"⇔\", \"冒\", \"嘩\", \"薪\", \"編\", \"心\", \"腹\", \"郭\", \"ン\", \"顎\", \"婿\", \"楚\", \"越\", \"💦\", \"岩\", \"訂\", \"紫\", \"請\", \"ヤ\", \"詫\", \"切\", \"像\", \"鋭\", \"賢\", \"注\", \"績\", \"乾\", \"枝\", \"膏\", \"w\", \"粉\", \"趨\", \"殖\", \"恋\", \"訪\", \"莽\", \"衛\", \"寂\", \"静\", \"詈\", \"ひ\", \"滅\", \"虜\", \"僚\", \"技\", \"も\", \"ソ\", \"調\", \"腐\", \"ぇ\", \"♫\", \"〕\", \"章\", \"月\", \"奥\", \"巻\", \"休\", \"魂\", \"憂\", \"デ\", \"境\", \"ノ\", \"ぁ\", \"鎌\", \"高\", \"贅\", \"随\", \"捺\", \"ト\", \"加\", \"薬\", \"ぎ\", \"波\", \"震\", \"歴\", \"昨\", \"y\", \"患\", \"璧\", \"給\", \"醤\", \"譜\", \"右\", \"憲\", \"管\", \"劣\", \"約\", \"饉\", \"庶\", \"浸\", \"献\", \"積\", \"鵜\", \"宋\", \"吠\", \"産\", \"逃\", \"君\", \"申\", \"軸\", \"拓\", \"備\", \"し\", \"紗\", \"萎\", \"謂\", \"使\", \"曰\", \"迦\", \"雷\", \"ゞ\", \"繊\", \"け\", \"招\", \"席\", \"泡\", \"駕\", \"搭\", \"攘\", \"欄\", \"宴\", \"恐\", \"盟\", \"醸\", \"劇\", \"排\", \"凌\", \"ヌ\", \"券\", \"遇\", \"冨\", \"蝋\", \"趣\", \"⑪\", \"憎\", \"局\", \"所\", \"仙\", \"奇\", \"o\", \"こ\", \"死\", \"憶\", \"◯\", \"整\", \"旨\", \"田\", \"〇\", \"忍\", \"墳\", \"O\", \"航\", \"Ⅹ\", \"贔\", \"※\", \"慢\", \"佳\", \"鶏\", \"斎\", \"般\", \"ョ\", \"̈\", \"終\", \"漢\", \"尿\", \"尼\", \"段\", \"答\", \"裁\", \"勧\", \"ッ\", \"杯\", \"す\", \"噛\", \"奉\", \"吸\", \"甥\", \"野\", \"ャ\", \"娠\", \"烙\", \"鞄\", \"締\", \"昭\", \"e\", \"簡\", \"最\", \"歩\", \"柏\", \"‼\", \"ゅ\", \"太\", \"吟\", \"康\", \"魅\", \"富\", \"弄\", \"歳\", \"呼\", \"旬\", \"機\", \"烹\", \"』\", \"̀\", \"辺\", \"丈\", \"弱\", \"餃\", \"脈\", \"傲\", \":\", \"諦\", \"掬\", \"拝\", \"幽\", \"那\", \"猶\", \"リ\", \"手\", \"〟\", \"世\", \"歯\", \"衿\", \"些\", \"嫡\", \"巾\", \"益\", \"!\", \"啜\", \"人\", \"渕\", \"忽\", \"暴\", \"微\", \"ユ\", \"″\", \"叫\", \"株\", \"丸\", \"↑\", \"俳\", \"蝶\", \"条\", \"荘\", \"無\", \"願\", \"拗\", \"塩\", \"蒸\", \"士\", \"封\", \"堡\", \"徳\", \"層\", \"処\", \"深\", \"捨\", \"『\", \"便\", \"碍\", \"膜\", \"巧\", \"肩\", \"覚\", \"善\", \"権\", \"彦\", \"腺\", \"汲\", \"関\", \"住\", \"軋\", \"花\", \"妨\", \"泣\", \"堰\", \"妃\", \"訴\", \"事\", \"宿\", \"阻\", \"素\", \"赤\", \"唾\", \"菅\", \"輿\", \"線\", \"繋\", \"ル\", \"謝\", \"彷\", \"猫\", \"彌\", \"登\", \"祐\", \"環\", \"消\", \"渇\", \"照\", \"汁\", \"フ\", \"面\", \"主\", \"適\", \"ち\", \"騙\", \"往\", \"︎\", \"功\", \"柔\", \"逼\", \"紡\", \"荒\", \"‐\", \"m\", \"中\", \"措\", \"語\", \"謬\", \"洩\", \"獄\", \"黙\", \"里\", \"厚\", \"★\", \"縛\", \"仔\", \"講\", \"簗\", \"せ\", \"ウ\", \"用\", \"拶\", \"星\", \"瓶\", \"易\", \"慌\", \"託\", \"顧\", \"壬\", \"殺\", \"真\", \"鈍\", \"速\", \"既\", \"蔵\", \"港\", \"寄\", \"彰\", \"殲\", \"六\", \"刃\", \"羊\", \"仮\", \"二\", \"頬\", \"邸\", \"目\", \"瑞\", \"」\", \"尋\", \"尺\", \"果\", \"景\", \"哲\", \"❤\", \"揺\", \"何\", \"塞\", \"‥\", \"徹\", \"貞\", \"購\", \"醍\", \"苑\", \"栄\", \"堆\", \"秩\", \"稿\", \"習\", \"魚\", \"枠\", \"践\", \"彩\", \"張\", \"在\", \"煩\", \"榴\", \"愛\", \"惜\", \"嘘\", \"逮\", \"ミ\", \"際\", \"棲\", \"鯖\", \"惚\", \"粒\", \"皮\", \"掌\", \"冥\", \"姉\", \"薩\", \"故\", \"価\", \"下\", \"販\", \"訃\", \"裂\", \"神\", \"崩\", \"維\", \"ヨ\", \"隣\", \"羅\", \"串\", \"糧\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/ko": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 1524839,
"_n_tokens": 334457,
"_n_chars": 655190,
"_n_oov_chars": 433242,
"oov_ratio": 0.6612463560188647,
"_oov_charset": "[\"ⓒ\", \"잖\", \"췌\", \"은\", \"빈\", \"族\", \"王\", \"갈\", \"싱\", \"체\", \"多\", \"修\", \"윙\", \"혁\", \"썰\", \"컨\", \"ã\", \"과\", \"댄\", \"킌\", \"삽\", \"탱\", \"낱\", \"竹\", \"백\", \"\", \"규\", \"德\", \"貿\", \"👏\", \"濟\", \"짭\", \"쫄\", \"솥\", \"률\", \"・\", \"월\", \"罰\", \"…\", \"딧\", \"콩\", \"ㅏ\", \"왠\", \"땀\", \"堯\", \"낌\", \"템\", \"닭\", \"쫓\", \"국\", \"쓰\", \"혔\", \"녕\", \"첫\", \"팹\", \"종\", \"밖\", \"읍\", \"토\", \"⑸\", \"짠\", \"獻\", \"깥\", \"三\", \"液\", \"둠\", \"햇\", \"폴\", \"진\", \"離\", \"쭈\", \"찬\", \"낭\", \"梁\", \"쒀\", \"⑨\", \"승\", \"ㅕ\", \"커\", \"먹\", \"詠\", \"깃\", \"ᴛ\", \"후\", \"헉\", \"목\", \"테\", \"떤\", \"緞\", \"쫒\", \"◈\", \"촉\", \"吳\", \"텀\", \"욥\", \"애\", \"꿀\", \"ㅘ\", \"캄\", \"허\", \"밉\", \"짢\", \"앞\", \"|\", \"쁠\", \"론\", \"代\", \"든\", \"쏜\", \"교\", \"🍰\", \"흙\", \"턱\", \"펼\", \"칵\", \"ⅰ\", \"좌\", \"털\", \"태\", \"믹\", \"돕\", \"Ⅲ\", \"저\", \"城\", \"꽁\", \"금\", \"◼\", \"럴\", \"㎥\", \"괄\", \"듭\", \"쪽\", \"앱\", \"닙\", \"끓\", \"―\", \"횡\", \"희\", \"布\", \"십\", \"삘\", \"질\", \"흡\", \"部\", \"픈\", \"間\", \"딥\", \"먼\", \"심\", \"굶\", \"有\", \"八\", \"칭\", \"탈\", \"뽑\", \"떻\", \"값\", \"淨\", \"🏷\", \"쥐\", \"陽\", \"킁\", \"뉴\", \"걍\", \"벨\", \"七\", \"百\", \"돈\", \"웨\", \"깽\", \"띕\", \"병\", \"흘\", \"소\", \"洞\", \"毛\", \"롯\", \"擒\", \"뿔\", \"→\", \"셌\", \"꽤\", \"봉\", \"ㅇ\", \"촨\", \"は\", \"퀸\", \"①\", \"≫\", \"룩\", \"包\", \"줏\", \"뽀\", \"여\", \"琪\", \"퀵\", \"빨\", \"뜬\", \"올\", \"엿\", \"연\", \"벼\", \"♡\", \"뢰\", \"너\", \"題\", \"😂\", \"별\", \"△\", \"똑\", \"系\", \"행\", \"걱\", \"겟\", \"하\", \"制\", \"이\", \"늘\", \"평\", \"ㅑ\", \"잤\", \"깊\", \"줌\", \"ㅓ\", \"죽\", \"靑\", \"몬\", \"닮\", \"솔\", \"뽐\", \"버\", \"⁴\", \"깅\", \"ㅚ\", \"텐\", \"童\", \"專\", \"【\", \"的\", \"잦\", \"닷\", \"픕\", \"켓\", \"딱\", \"카\", \"받\", \"튿\", \"똥\", \"●\", \"벵\", \"름\", \"왕\", \"떳\", \"엎\", \"귈\", \"캣\", \"튼\", \"「\", \"퍼\", \"릇\", \"끼\", \"란\", \"덟\", \"🍟\", \"민\", \"켄\", \"억\", \"〔\", \"⑵\", \"蜀\", \"땅\", \"\", \"길\", \"칼\", \"副\", \"ㅎ\", \"숏\", \"福\", \"귀\", \"뮌\", \"某\", \"훈\", \"삐\", \"퍙\", \"루\", \"脱\", \"붐\", \"女\", \"】\", \"*\", \"젠\", \"뻐\", \"榜\", \"궐\", \"邑\", \"숙\", \"〮\", \"地\", \"存\", \"쏭\", \"좇\", \"걷\", \"증\", \"뺏\", \"줘\", \"꽂\", \"行\", \"벽\", \"甲\", \"鐘\", \"독\", \"또\", \"ㅡ\", \"ㅖ\", \"랜\", \"巡\", \"칙\", \"💌\", \"옵\", \"례\", \"꺄\", \"雪\", \"學\", \"툼\", \"컸\", \"治\", \"術\", \"參\", \"곳\", \"크\", \"넵\", \"석\", \"정\", \"標\", \"랙\", \"民\", \"女\", \"뜯\", \"략\", \"史\", \"따\", \"틸\", \"뛴\", \"🍔\", \"뱅\", \"솜\", \"혐\", \"춘\", \"깔\", \"총\", \"銀\", \"른\", \"米\", \"머\", \"수\", \"㎞\", \"액\", \"꿈\", \"川\", \"實\", \"설\", \"삿\", \"슐\", \"끽\", \"립\", \"쁘\", \"퀄\", \"書\", \"새\", \"성\", \"몰\", \"륨\", \"춧\", \"랫\", \"➌\", \"守\", \"쿤\", \"존\", \"初\", \"말\", \"옌\", \"보\", \"致\", \"샌\", \"뵙\", \"며\", \"능\", \"♧\", \"했\", \"늦\", \"점\", \"밀\", \"법\", \"항\", \"읽\", \"쿄\", \"관\", \"ᴇ\", \"?\", \"갤\", \"랄\", \"둑\", \"춥\", \"衣\", \"빅\", \"꼭\", \"팰\", \"쿨\", \"육\", \"릿\", \"쨌\", \"十\", \"안\", \"씀\", \"가\", \"줄\", \"쯔\", \"칠\", \"겁\", \"기\", \"齋\", \"➊\", \"훅\", \"勢\", \"떼\", \"Ⅱ\", \"퀘\", \"썼\", \"뛰\", \"草\", \"毒\", \"눌\", \"낮\", \"왓\", \"團\", \"北\", \"갯\", \"틴\", \"채\", \"앎\", \"文\", \"싹\", \"늬\", \"^\", \"둡\", \"不\", \"짬\", \"음\", \"딜\", \"팜\", \"훗\", \"출\", \"헨\", \"秋\", \"밑\", \"지\", \"위\", \"결\", \"투\", \"픽\", \"窮\", \"⬇\", \"멕\", \"↕\", \"않\", \"天\", \"穀\", \"츈\", \"텁\", \"μ\", \"피\", \"명\", \"읊\", \"뿜\", \"흑\", \"딘\", \"業\", \"무\", \"셨\", \"쉼\", \"막\", \"눠\", \"슛\", \"슝\", \"왼\", \"㉿\", \"公\", \"曆\", \"휴\", \"헐\", \"겸\", \"곰\", \"帝\", \"☆\", \"쿠\", \"◎\", \"녁\", \"經\", \"♤\", \"←\", \"頭\", \"텨\", \"치\", \"光\", \"벙\", \"笠\", \"닐\", \"운\", \"광\", \"것\", \"웰\", \"아\", \"함\", \"룬\", \"놓\", \"榮\", \"ㅙ\", \"└\", \"홋\", \"겪\", \"洋\", \"딛\", \"렌\", \"및\", \"樂\", \"뒤\", \"뭇\", \"낄\", \"思\", \"옮\", \"람\", \"핫\", \"渴\", \"贖\", \"샵\", \"을\", \"필\", \"ㄷ\", \"쏘\", \"스\", \"긴\", \"ㅐ\", \"갓\", \"잔\", \"샘\", \"載\", \"悖\", \"쇄\", \"明\", \"각\", \"뭔\", \"者\", \"쭉\", \"特\", \"껀\", \"훔\", \"變\", \"맬\", \"🦅\", \"쪄\", \"假\", \"聖\", \"션\", \"字\", \"히\", \"投\", \"벚\", \"歲\", \"즙\", \"뺀\", \"道\", \"쳤\", \"孝\", \"敬\", \"준\", \"얏\", \"겔\", \"犬\", \"확\", \"꾀\", \"잴\", \"똘\", \"。\", \"理\", \"잭\", \"캡\", \"씬\", \"시\", \"욜\", \"봬\", \"앉\", \"잉\", \"弊\", \"된\", \"댐\", \"력\", \"랩\", \"±\", \"콰\", \"면\", \"화\", \"쉰\", \"共\", \"然\", \"방\", \"반\", \"옥\", \"知\", \"냥\", \"협\", \"뜹\", \"한\", \"」\", \"陸\", \"夜\", \"텍\", \"意\", \"폼\", \"선\", \"붉\", \"樂\", \"求\", \"\\\\\", \"쎈\", \"겠\", \"골\", \"얀\", \"茅\", \"밋\", \"굳\", \"더\", \"츄\", \"빴\", \"밸\", \"永\", \"튀\", \"짖\", \"쑤\", \"굿\", \"듐\", \"켈\", \"구\", \"롱\", \"짐\", \"팠\", \"뭥\", \"얕\", \"갔\", \"격\", \"男\", \"朝\", \"섹\", \"궤\", \"빙\", \"俠\", \"케\", \"멜\", \"🤗\", \"♪\", \"깨\", \"솨\", \"패\", \"묘\", \"줍\", \"魔\", \"코\", \"④\", \"🌿\", \"듣\", \"썬\", \"志\", \"릴\", \"혈\", \"셸\", \"➎\", \"송\", \"멍\", \"듀\", \"셈\", \"찌\", \"軒\", \"쁨\", \"줬\", \"룸\", \"걀\", \"넬\", \"켠\", \"向\", \"옳\", \"可\", \"院\", \"갇\", \"낍\", \"암\", \"春\", \"폈\", \"푹\", \"입\", \"Ⅵ\", \"꺾\", \"랴\", \"매\", \"▼\", \"퓨\", \"℃\", \"쳇\", \"뜨\", \"봤\", \"퇴\", \"쉘\", \"自\", \"否\", \"꽃\", \"띄\", \"✈\", \"료\", \"넉\", \"序\", \"툴\", \"혼\", \"덤\", \"�\", \"겹\", \"엉\", \"룰\", \"녘\", \"고\", \"◾\", \"㎡\", \"돗\", \"곡\", \"핍\", \"옆\", \"覆\", \"됨\", \"닳\", \"쥔\", \"랭\", \"◑\", \"🤔\", \"좀\", \"멘\", \"樹\", \"만\", \"九\", \"맞\", \"ㅆ\", \"적\", \"삭\", \"킹\", \"현\", \"◀\", \"달\", \"商\", \"클\", \"係\", \"녔\", \"뮐\", \"싶\", \"㈜\", \"순\", \"第\", \"家\", \"챔\", \"탰\", \"綃\", \"핵\", \"밧\", \"있\", \"累\", \"얘\", \"🙋\", \"뱃\", \"ㅠ\", \"改\", \"욕\", \"맨\", \"뀌\", \"뭘\", \"중\", \"😱\", \"흗\", \"붕\", \"빡\", \"쾌\", \"Ⅳ\", \"諒\", \"급\", \"누\", \"밟\", \"셰\", \"年\", \"途\", \"©\", \"戊\", \"맷\", \"💥\", \"農\", \"렷\", \"렘\", \"령\", \"트\", \"黃\", \"悧\", \"💰\", \"윗\", \"金\", \"貸\", \"꾸\", \"雄\", \"뎅\", \"좋\", \"찔\", \"東\", \"쩍\", \"․\", \"一\", \"타\", \"飾\", \"몽\", \"빕\", \"宮\", \"접\", \"谷\", \"폄\", \"눔\", \"法\", \"方\", \"찼\", \"힉\", \"휠\", \"😊\", \"캐\", \"펩\", \"싼\", \"쟤\", \"뻑\", \"찜\", \"겉\", \"닫\", \"뤼\", \"唐\", \"윌\", \"껴\", \"택\", \"렀\", \"꿍\", \"봇\", \"瀧\", \"즈\", \"킥\", \"巳\", \"己\", \"문\", \"交\", \"✔\", \"군\", \"픔\", \"킵\", \"뮤\", \"슬\", \"§\", \"될\", \"쌩\", \"푼\", \"峰\", \"볶\", \"씌\", \"革\", \"끝\", \"살\", \"集\", \"웖\", \"👍\", \"바\", \"v\", \"녀\", \"칫\", \"다\", \"샹\", \"래\", \"友\", \"金\", \"불\", \"물\", \"꺼\", \"和\", \"혜\", \"졌\", \"냠\", \"뚜\", \"回\", \"깝\", \"賣\", \"쐐\", \"꺽\", \"던\", \"팝\", \"힘\", \"林\", \"利\", \"슨\", \"었\", \"샐\", \"弟\", \"韓\", \"s\", \"팬\", \"拘\", \"팅\", \"높\", \"述\", \"\", \"良\", \"느\", \"쁜\", \"굴\", \"일\", \"淘\", \"쥰\", \"잘\", \"界\", \"@\", \"種\", \"짤\", \"섯\", \"핸\", \"펌\", \"팥\", \"雙\", \"압\", \"언\", \"紀\", \"자\", \"널\", \"呪\", \"눅\", \"의\", \"〈\", \"삣\", \"<\", \"😭\", \"Ⅶ\", \"찰\", \"맥\", \"죠\", \"子\", \"節\", \"년\", \"잃\", \"駐\", \"볍\", \"乳\", \"國\", \"큼\", \"卒\", \"휩\", \"훠\", \"밌\", \"解\", \"벗\", \"붙\", \"原\", \"믿\", \"팩\", \"싸\", \"움\", \"安\", \"쿼\", \"집\", \"옛\", \"↔\", \"極\", \"훨\", \"걸\", \"乙\", \"돠\", \"🌵\", \"서\", \"邦\", \"숭\", \"換\", \"◆\", \"같\", \"창\", \"ㅁ\", \"께\", \"ń\", \"뤄\", \"청\", \"캇\", \"넣\", \"꿰\", \"皇\", \"둬\", \"식\", \"被\", \"外\", \"얄\", \"α\", \"앰\", \"림\", \"蚩\", \"혹\", \"렜\", \"즌\", \"뷰\", \"닦\", \"왜\", \"팁\", \" \", \"떴\", \"섭\", \"い\", \"~\", \"〉\", \"왘\", \"樺\", \"辰\", \"흄\", \"耕\", \"릅\", \"💣\", \"촬\", \"⑧\", \"층\", \"묶\", \"🏻\", \"∮\", \"휘\", \"드\", \"열\", \"셀\", \"휙\", \"낚\", \"빌\", \"立\", \"합\", \"藥\", \"할\", \"캔\", \"벤\", \"어\", \"울\", \"븐\", \"곶\", \"첼\", \"荻\", \"듬\", \"留\", \"친\", \"敎\", \"냉\", \"現\", \"힙\", \"팽\", \"헝\", \"陰\", \"티\", \"형\", \"짙\", \"덧\", \"추\", \"껏\", \"윤\", \"홉\", \"펄\", \"뮈\", \"③\", \"獨\", \"톤\", \"절\", \"門\", \"씹\", \"資\", \"논\", \"빤\", \"仁\", \"놨\", \"됬\", \"立\", \"갚\", \"끈\", \"섬\", \"ㅛ\", \"꾼\", \"딩\", \"겨\", \"엌\", \"🚨\", \"平\", \"닝\", \"🚿\", \"갑\", \"뱉\", \"활\", \"릎\", \"럭\", \"왔\", \"뀐\", \"☎\", \"뉘\", \"▒\", \"슴\", \"詔\", \"넌\", \"て\", \"角\", \"임\", \"ㅔ\", \"體\", \"런\", \"즐\", \"ㄴ\", \"셔\", \"五\", \"댁\", \"ㅣ\", \"갉\", \"쭙\", \"간\", \"앵\", \"蒙\", \"세\", \"엑\", \"\", \"之\", \"원\", \"갱\", \"레\", \"堂\", \"긋\", \"탠\", \"깜\", \"갖\", \"틈\", \"떡\", \"雲\", \"動\", \"몸\", \"쥬\", \"才\", \"둔\", \"ㄱ\", \"臀\", \"졸\", \"ㆍ\", \"에\", \"젤\", \"ㅈ\", \"選\", \"論\", \"톨\", \"냈\", \"上\", \"푸\", \"客\", \"結\", \"陳\", \"배\", \"›\", \"앤\", \"재\", \"책\", \"ㅍ\", \"理\", \"떠\", \"녹\", \"밤\", \"를\", \"렁\", \"툰\", \"쏠\", \"맵\", \"싫\", \"%\", \"공\", \"튜\", \"블\", \"궈\", \"굽\", \"켜\", \"뺐\", \"폍\", \"乃\", \"反\", \"峴\", \"津\", \"챗\", \"信\", \"ㅞ\", \"앨\", \"`\", \"댔\", \"워\", \"💅\", \"첩\", \"Ⅴ\", \"왁\", \"춰\", \"몫\", \"섣\", \"始\", \"識\", \"믐\", \"▲\", \"본\", \"㉰\", \"同\", \"工\", \"關\", \"켤\", \"장\", \"역\", \"앗\", \"싯\", \"白\", \"望\", \"낡\", \"ᴡ\", \"익\", \"외\", \"눕\", \"Ⅷ\", \"퍽\", \"玉\", \"제\", \"⚀\", \"ㅝ\", \"肉\", \"낫\", \"쐬\", \"뭐\", \"쓸\", \"묻\", \"갛\", \"}\", \"숍\", \"濁\", \"견\", \"ᴍ\", \"최\", \"略\", \"꼴\", \"課\", \"料\", \"先\", \"듈\", \"뜸\", \"탐\", \"新\", \"미\", \"生\", \"ⅲ\", \"상\", \"짱\", \"南\", \"분\", \"건\", \"兄\", \"▷\", \"싣\", \"《\", \"哀\", \"획\", \"뭉\", \"出\", \"젝\", \"合\", \"쩌\", \"탓\", \"페\", \"政\", \"仲\", \"굵\", \"벅\", \"쟈\", \"긍\", \"멀\", \"닌\", \"렇\", \"랬\", \"짚\", \"ᴄ\", \"콜\", \"벳\", \"펴\", \"뻗\", \"쓕\", \"쾅\", \"넘\", \"ㅊ\", \"듯\", \"쫀\", \"샤\", \"브\", \"염\", \"멤\", \"덩\", \"웁\", \"감\", \"房\", \"샀\", \"쿰\", \"술\", \"비\", \"⑹\", \"ω\", \"🤕\", \"水\", \"팎\", \"틱\", \"ㅗ\", \"짓\", \"콤\", \"경\", \"룡\", \"口\", \"姜\", \"🙆\", \"⑦\", \"댈\", \"곽\", \"빼\", \"델\", \"킴\", \"찮\", \"價\", \"🙌\", \"온\", \"맡\", \"셋\", \"괴\", \"괜\", \"핥\", \"山\", \"인\", \"톰\", \"천\", \"핑\", \"통\", \"데\", \"르\", \"킨\", \"콕\", \"빔\", \"번\", \"렵\", \"록\", \"뇨\", \"핏\", \"紋\", \"환\", \"렐\", \"♣\", \"➋\", \"밝\", \"🦄\", \"린\", \"틋\", \"몹\", \"相\", \"악\", \"팔\", \"사\", \"뿌\", \"곤\", \"×\", \"봄\", \"펜\", \"맺\", \"좁\", \"됩\", \"빛\", \"짧\", \"➏\", \"걔\", \"쫑\", \"❍\", \"띈\", \"홑\", \"■\", \"古\", \"젖\", \"長\", \"⇒\", \"퉁\", \"웃\", \"그\", \"應\", \"렴\", \"龍\", \"생\", \"♥\", \"대\", \"융\", \"摩\", \"묵\", \"英\", \"璿\", \"량\", \"뀔\", \"효\", \"산\", \"렬\", \"풍\", \"↓\", \"魯\", \"응\", \"돔\", \"렸\", \"딴\", \"늄\", \"誡\", \"족\", \"닥\", \"힜\", \"會\", \"샴\", \"삶\", \"디\", \"뎀\", \"겼\", \"居\", \"뗀\", \"亨\", \"멋\", \"박\", \"쌓\", \"측\", \"짜\", \"쩡\", \"뉜\", \"ɪ\", \"실\", \"直\", \"곧\", \"힌\", \"빚\", \"덜\", \"◦\", \"正\", \"썹\", \"엘\", \"薄\", \"곱\", \"난\", \"劫\", \"뜩\", \"🍭\", \"😣\", \"\", \"잰\", \"럼\", \"홈\", \"팀\", \"플\", \"ᴏ\", \"枯\", \"엇\", \"흥\", \"맴\", \"롤\", \"좆\", \"냐\", \"촛\", \"授\", \"⑴\", \"火\", \"겐\", \"∙\", \"썸\", \"낯\", \"당\", \"警\", \"닛\", \"쎄\", \"胡\", \"밥\", \"土\", \"≪\", \"俗\", \"☞\", \"편\", \"몇\", \"룹\", \"콥\", \"업\", \"槪\", \"能\", \"꿕\", \"常\", \"납\", \"後\", \" \", \"므\", \"릉\", \"戮\", \"發\", \"텅\", \"우\", \"食\", \"켐\", \"言\", \"펠\", \"랐\", \"습\", \"侯\", \"강\", \"뛸\", \"색\", \"御\", \"쌈\", \"そ\", \"권\", \"슷\", \"두\", \"탕\", \"쇼\", \"{\", \"죄\", \"훌\", \"好\", \"韜\", \"華\", \"ㅅ\", \"社\", \"큐\", \"얽\", \"뫼\", \"섰\", \"단\", \"色\", \"뱀\", \"廟\", \"조\", \"틔\", \"넹\", \"끙\", \"⋅\", \"뚫\", \"뼈\", \"比\", \"꼬\", \"농\", \"至\", \"亭\", \"네\", \"쬐\", \"낙\", \"驚\", \"斗\", \"妻\", \"命\", \"즘\", \"軍\", \"튠\", \"靈\", \"빳\", \"쿵\", \"⊙\", \"💡\", \"禮\", \"알\", \"끗\", \"처\", \"쏟\", \"뾱\", \"범\", \"낀\", \"끔\", \"날\", \"析\", \"계\", \"캠\", \"톡\", \"病\", \"깡\", \"힐\", \"셜\", \"祉\", \"뚝\", \"옴\", \"抗\", \"탭\", \"꿇\", \"》\", \"ㅒ\", \"발\", \"철\", \"맛\", \"손\", \"됐\", \"□\", \"링\", \"群\", \"끊\", \"혀\", \"웅\", \"朱\", \"텝\", \"멸\", \"부\", \"톱\", \"넛\", \"類\", \"황\", \"객\", \"륭\", \"많\", \"武\", \"눈\", \"도\", \"弛\", \"셉\", \"籍\", \"첸\", \"꼈\", \"程\", \"전\", \"射\", \"😗\", \"헛\", \"츠\", \"로\", \"\", \"퀴\", \"틀\", \"껍\", \"宗\", \"쨍\", \"벌\", \"쵸\", \"🍕\", \"🍎\", \"내\", \"日\", \"둘\", \"득\", \"앙\", \"꿔\", \"譯\", \"江\", \"앓\", \"램\", \"💸\", \"婚\", \"망\", \"美\", \"호\", \"뵐\", \"덮\", \"라\", \"잠\", \"情\", \"典\", \"빠\", \"튬\", \"쩔\", \"協\", \"숫\", \"죤\", \"툭\", \"흠\", \"壽\", \"검\", \"둥\", \"汰\", \"헌\", \"봅\", \"췄\", \"全\", \"엠\", \"닉\", \"님\", \"맹\", \"②\", \"璣\", \"륙\", \"굉\", \"師\", \"時\", \"戌\", \"ᴀ\", \"燭\", \"놔\", \"紙\", \"궁\", \"숱\", \"ʏ\", \"놈\", \"🔹\", \"표\", \"🤭\", \"궜\", \"롭\", \"「\", \"👨\", \"劍\", \"빗\", \"베\", \"튄\", \"차\", \"덴\", \"숟\", \"化\", \"썩\", \"땠\", \"메\", \"센\", \"놀\", \"텔\", \"숯\", \"²\", \"섞\", \"氷\", \"ⅱ\", \"쑥\", \"엡\", \"뜻\", \"次\", \"海\", \"寛\", \"탄\", \"동\", \"잣\", \"챙\", \"臥\", \"㉣\", \"大\", \"衡\", \"리\", \"맙\", \"\", \"컬\", \"뷔\", \"찢\", \"폭\", \"뮬\", \"풀\", \"신\", \"북\", \"흩\", \"칩\", \"초\", \"쾨\", \"뼘\", \"壞\", \"웬\", \"鮮\", \"덥\", \"쇠\", \"뺑\", \"영\", \"침\", \"뜰\", \"첨\", \"잇\", \"性\", \"였\", \"科\", \"燦\", \"冬\", \"풋\", \"퓰\", \"때\", \"숲\", \"나\", \"려\", \"킷\", \"흐\", \"꼽\", \"닿\", \"쩐\", \"ㄹ\", \"分\", \"員\", \"짊\", \"㏊\", \"젊\", \"將\", \"坐\", \"쪼\", \"컷\", \"넷\", \"덕\", \"㎍\", \"💕\", \"까\", \"볕\", \"취\", \"뿐\", \"캘\", \"거\", \"났\", \"롸\", \"춤\", \"峙\", \"맘\", \"렉\", \"흰\", \"끄\", \"쉽\", \"쳐\", \"ⅳ\", \"◇\", \"쟁\", \"폐\", \"괌\", \"京\", \"넓\", \"ⓔ\", \"딤\", \"개\", \"◐\", \"넥\", \"꽝\", \"○\", \"큰\", \"폿\", \"옐\", \"징\", \"蟄\", \"心\", \"흔\", \"옹\", \"긁\", \"💦\", \"깁\", \"럽\", \"포\", \"짝\", \"찍\", \"참\", \"뻔\", \"칸\", \"옷\", \"☀\", \"像\", \"킬\", \"쫗\", \"뒀\", \"턴\", \"쌀\", \"∼\", \"不\", \"🙇\", \"衛\", \"게\", \"탬\", \"숨\", \"축\", \"滅\", \"충\", \"낼\", \"技\", \"렛\", \"랑\", \"냄\", \"〕\", \"약\", \"🌳\", \"떄\", \"章\", \"月\", \"완\", \"딸\", \"高\", \"🥁\", \"학\", \"퀀\", \"얻\", \"륵\", \"유\", \"얍\", \"딪\", \"씨\", \"횟\", \"릭\", \"째\", \"눴\", \"헬\", \"趺\", \"管\", \"·\", \"觸\", \"얹\", \"ㅜ\", \"♀\", \"녜\", \"쯤\", \"宋\", \"君\", \"잡\", \"申\", \"し\", \"曰\", \"류\", \"說\", \"향\", \"빵\", \"‧\", \"써\", \"욱\", \"예\", \"썅\", \"즉\", \"盟\", \"콘\", \"볼\", \"햄\", \"쌍\", \"섦\", \"양\", \"뻤\", \"씩\", \"所\", \"챨\", \"노\", \"율\", \"氣\", \"용\", \"Ⅰ\", \"남\", \"귤\", \"死\", \"臺\", \"넨\", \"복\", \"훼\", \"터\", \"돌\", \"¹\", \"촘\", \"Ⅹ\", \"※\", \"팟\", \"鎭\", \"펙\", \"띤\", \"漢\", \"≤\", \"す\", \"회\", \"奉\", \"\", \"ㅢ\", \"켰\", \"野\", \"직\", \"답\", \"昭\", \"변\", \"▶\", \"되\", \"오\", \"훑\", \"와\", \"롬\", \"康\", \"꽉\", \"밭\", \"니\", \"流\", \"👋\", \"➍\", \"藝\", \"땐\", \"機\", \"』\", \"뇌\", \"러\", \"척\", \"잊\", \"윈\", \":\", \"댓\", \"특\", \"럿\", \"엣\", \"냅\", \"들\", \"펑\", \"깐\", \"手\", \"껑\", \"땡\", \"돼\", \"世\", \"돋\", \"져\", \"끌\", \"쏙\", \"랍\", \"락\", \"▣\", \"없\", \"人\", \"요\", \"념\", \"뒷\", \"眞\", \"았\", \"↑\", \"키\", \"無\", \"밍\", \"❏\", \"맑\", \"잼\", \"얇\", \"徳\", \"엄\", \"험\", \"『\", \"촌\", \"善\", \"씽\", \"팡\", \"균\", \"數\", \"🏫\", \"拜\", \"跏\", \"엮\", \"事\", \"핀\", \"판\", \"붓\", \"낸\", \"샬\", \"젓\", \"작\", \"헤\", \"⑶\", \"쉬\", \"謝\", \"모\", \"️\", \"祐\", \"밴\", \"꿨\", \"극\", \"해\", \"面\", \"主\", \"適\", \"웠\", \"샷\", \"︎\", \"홀\", \"김\", \"솟\", \"등\", \"🗺\", \"근\", \"中\", \"쿡\", \"캉\", \"語\", \"對\", \"삼\", \"里\", \"착\", \"★\", \"웍\", \"쌉\", \"믄\", \"用\", \"봐\", \"프\", \"탑\", \"련\", \"星\", \"㉠\", \"야\", \"흉\", \"엔\", \"펀\", \"易\", \"殺\", \"큽\", \"엽\", \"ㅋ\", \"글\", \"으\", \"🍞\", \"六\", \"늑\", \"떨\", \"씻\", \"챌\", \"늙\", \"目\", \"」\", \"Ⅸ\", \"❤\", \"웹\", \"뤘\", \"烏\", \"팍\", \"곁\", \"何\", \"품\", \"얼\", \"龍\", \"륜\", \"🤟\", \"‥\", \"뿍\", \"홍\", \"쉴\", \"⑤\", \"멈\", \"ʟ\", \"슈\", \"卽\", \"못\", \"魚\", \"컴\", \"파\", \"⑥\", \"갭\", \"잎\", \"屠\", \"컵\", \"愛\", \"찾\", \"際\", \"낳\", \"飮\", \"마\", \"탁\", \"皮\", \"掌\", \"內\", \"주\", \"故\", \"담\", \"下\", \"는\", \"神\", \"폰\", \"띠\", \"尤\", \"속\", \"拮\", \"쓴\", \"ㅟ\"]",
"reversible": false
},
"google/switch-c-2048 @ cc100/zh-Hans": {
"tokenizer": "switch-c-2048",
"organization": "Google",
"vocab_size": 32100,
"_n_bytes": 2633047,
"_n_tokens": 163519,
"_n_chars": 927311,
"_n_oov_chars": 865446,
"oov_ratio": 0.9332855967415462,
"_oov_charset": "[\"蜂\", \"嘎\", \"腾\", \"募\", \"\", \"现\", \"茫\", \"门\", \"话\", \"叨\", \"惨\", \"又\", \"鱼\", \"族\", \"青\", \"⒀\", \"撬\", \"C\", \"王\", \"多\", \"呈\", \"婆\", \"赌\", \"涎\", \"袱\", \"蕤\", \"声\", \"修\", \"聚\", \"廊\", \"皂\", \"恢\", \".\", \"湄\", \"恪\", \"當\", \"踞\", \"朋\", \"卉\", \"葱\", \"训\", \"玷\", \"巴\", \"词\", \"眼\", \"赴\", \"竹\", \"页\", \"狸\", \"挈\", \"\", \"贵\", \"噌\", \"德\", \"贱\", \"杆\", \"浙\", \"汐\", \"吮\", \"疾\", \"禄\", \"统\", \"坊\", \"t\", \"示\", \"呸\", \"脯\", \"术\", \"仄\", \"剽\", \"服\", \"谔\", \"尴\", \"继\", \"蒂\", \"皿\", \"卍\", \"・\", \"牲\", \"咽\", \"蝌\", \"耶\", \"吱\", \"形\", \"癖\", \"级\", \"啤\", \"…\", \"蹦\", \"络\", \"洪\", \"旖\", \"懂\", \"员\", \"睹\", \"考\", \"锡\", \"胥\", \"例\", \"戍\", \"纱\", \"建\", \"姿\", \"姻\", \"贴\", \"帆\", \"玖\", \"⒁\", \"腿\", \"狄\", \"渗\", \"饥\", \"悦\", \"仇\", \"旋\", \"聪\", \"悟\", \"因\", \"禧\", \"蹩\", \"念\", \"喀\", \"渐\", \"円\", \"茶\", \"掂\", \"炒\", \"・\", \"卑\", \"⑸\", \"葫\", \"浏\", \"返\", \"泄\", \"朴\", \"脊\", \"邃\", \"筷\", \"侣\", \"咦\", \"肿\", \"桔\", \"劑\", \"三\", \"酋\", \"為\", \"冠\", \"娼\", \"退\", \"诀\", \"液\", \"敛\", \"斩\", \"馨\", \"挣\", \"擘\", \"佬\", \"惺\", \"叉\", \"耩\", \"滚\", \"摧\", \"畴\", \"小\", \"吴\", \"梁\", \"⑨\", \"威\", \"敦\", \"祟\", \"灿\", \"&\", \"壮\", \"怨\", \"未\", \"调\", \"泠\", \"俄\", \"孜\", \"蓦\", \"谋\", \"槌\", \"怪\", \"埃\", \"哧\", \"埋\", \"项\", \"滢\", \"獗\", \"魁\", \"脚\", \"嘉\", \"曦\", \"淡\", \"翡\", \"搡\", \"缉\", \"推\", \"闹\", \"汕\", \"辱\", \"概\", \"逐\", \"殿\", \"辄\", \"拳\", \"袒\", \"沃\", \"钦\", \"坯\", \"际\", \"姓\", \"怎\", \"厘\", \"炫\", \"代\", \"拌\", \"箭\", \"喜\", \"谱\", \"痰\", \"锻\", \"域\", \"氛\", \"挂\", \"佟\", \"忌\", \"漂\", \"揽\", \"附\", \"告\", \"了\", \"臧\", \"舌\", \"惬\", \"质\", \"牺\", \"寥\", \"撒\", \"刮\", \"蓝\", \"奶\", \""\", \"漩\", \"填\", \"驳\", \"氏\", \"城\", \"坷\", \"么\", \"徽\", \"玲\", \"励\", \"融\", \"堪\", \"忱\", \"弦\", \"妈\", \"媛\", \"趾\", \"―\", \"聆\", \"垒\", \"棍\", \"布\", \"树\", \"这\", \"杏\", \"部\", \"贫\", \"網\", \"镏\", \"证\", \"冲\", \"菇\", \"吆\", \"荆\", \"沛\", \"挽\", \"挚\", \"楂\", \"闸\", \"教\", \"有\", \"八\", \"离\", \"鬓\", \"括\", \"记\", \"斯\", \"促\", \"挺\", \"吐\", \"砸\", \"容\", \"竣\", \"役\", \"辟\", \"冈\", \"猥\", \"擞\", \"诶\", \"窿\", \"袖\", \"τ\", \"逞\", \"眨\", \"倨\", \"余\", \"刹\", \"派\", \"西\", \"河\", \"牵\", \"七\", \"侮\", \"百\", \"湘\", \"媳\", \"矣\", \"件\", \"颌\", \"p\", \"截\", \"厌\", \"帘\", \"苇\", \"护\", \"禅\", \"承\", \"洞\", \"毛\", \"汽\", \"忠\", \"憧\", \"盈\", \"泉\", \"得\", \"厨\", \"接\", \"窜\", \"愤\", \"嫌\", \"聊\", \"东\", \"→\", \"驴\", \"醐\", \"察\", \"诱\", \"丽\", \"弗\", \"黑\", \"软\", \"①\", \"咨\", \"喇\", \"邓\", \"影\", \"杖\", \"椭\", \"包\", \"遴\", \"碧\", \"伸\", \"杜\", \"屋\", \"旺\", \"蓄\", \"围\", \"惮\", \"表\", \"晴\", \"业\", \"迈\", \"桂\", \"魏\", \"努\", \"息\", \"机\", \"琪\", \"众\", \"邪\", \"汪\", \"祥\", \"哪\", \"霖\", \"鹰\", \"残\", \"泯\", \"赏\", \"筛\", \"翊\", \"系\", \"宣\", \"笋\", \"轻\", \"托\", \"她\", \"症\", \"根\", \"制\", \"透\", \"节\", \"雏\", \"押\", \"删\", \"虐\", \"酒\", \"萝\", \"赅\", \"跳\", \"濒\", \"蛊\", \"顿\", \"膨\", \"润\", \"懦\", \"近\", \"培\", \"嘲\", \"躯\", \"燎\", \"头\", \"克\", \"镀\", \"册\", \"风\", \"勿\", \"強\", \"缩\", \"崎\", \"渡\", \"〖\", \"童\", \"揍\", \"陡\", \"催\", \"倒\", \"今\", \"库\", \"的\", \"杭\", \"【\", \"癫\", \"怂\", \"剩\", \"泱\", \"宁\", \"恳\", \"陪\", \"珏\", \"惦\", \"●\", \"呐\", \"猖\", \"尔\", \"挠\", \"峥\", \"紧\", \"喊\", \"脆\", \"沿\", \"跪\", \"拯\", \"庚\", \"霹\", \"亵\", \"县\", \"骨\", \"凶\", \"「\", \"偿\", \"衬\", \"撐\", \"靴\", \"司\", \"检\", \"零\", \"黏\", \"泌\", \"黧\", \"圆\", \"烬\", \"扉\", \"〔\", \"蜀\", \"姣\", \"物\", \"缥\", \"柘\", \"黩\", \"荨\", \"折\", \"享\", \"见\", \"毯\", \"瑶\", \"雅\", \"權\", \"踩\", \"旦\", \"闭\", \"副\", \"枷\", \"炕\", \"笃\", \"核\", \"找\", \"闻\", \"智\", \"幼\", \"福\", \"由\", \"束\", \"楼\", \"矗\", \"虎\", \"粱\", \"某\", \"即\", \"瘾\", \"依\", \"罩\", \"麓\", \"栖\", \"瞠\", \"葆\", \"潭\", \"冤\", \"累\", \"岚\", \"母\", \"脱\", \"拼\", \"據\", \"5\", \"】\", \"n\", \"绍\", \"座\", \"添\", \"岐\", \"遍\", \"凹\", \"凉\", \"及\", \"履\", \"秀\", \"陵\", \"戳\", \"完\", \"戾\", \"限\", \"学\", \"冯\", \"睐\", \"粟\", \"顺\", \"蔬\", \"当\", \"榜\", \"阀\", \"邑\", \"地\", \"帕\", \"存\", \"侧\", \"狱\", \"盖\", \"呵\", \"~\", \"陈\", \"裙\", \"婉\", \"辉\", \"邬\", \"糠\", \"担\", \"汩\", \"蚊\", \"罕\", \"钩\", \"甯\", \"刘\", \"行\", \"宸\", \"药\", \"芥\", \"剪\", \"钥\", \"畸\", \"吃\", \"忆\", \"臼\", \"镭\", \"萍\", \"恩\", \"甲\", \"庭\", \"嘻\", \"俞\", \"祛\", \"メ\", \"队\", \"沉\", \"颈\", \"本\", \"抛\", \"薇\", \"陆\", \"烘\", \"憨\", \"荟\", \"禽\", \"彙\", \"锥\", \"愉\", \"咀\", \"府\", \"巡\", \"芃\", \"旅\", \"哺\", \"喔\", \"猜\", \"樱\", \"惩\", \"庙\", \"瑜\", \"贬\", \"轰\", \"竭\", \"雪\", \",\", \"令\", \"嫁\", \"松\", \"治\", \"乌\", \"壶\", \"蔷\", \"讶\", \"鲱\", \"国\", \"粤\", \"痫\", \"算\", \"识\", \"標\", \"瘠\", \"民\", \"店\", \"嫂\", \"女\", \"书\", \"跃\", \"耙\", \"史\", \"抿\", \"占\", \"霜\", \"蟑\", \"歼\", \"褪\", \"等\", \"跟\", \"酿\", \"萦\", \"诨\", \"龟\", \"雯\", \"尊\", \"澎\", \"验\", \"耀\", \"戴\", \"瑰\", \"阽\", \"凄\", \"鲎\", \"匪\", \"卵\", \"箔\", \"痊\", \"曲\", \"远\", \"绣\", \"开\", \"掖\", \"枢\", \"篮\", \"鸭\", \"彻\", \"米\", \"墅\", \"练\", \"雇\", \"荫\", \"川\", \"疸\", \"咱\", \"张\", \"莎\", \"争\", \"泰\", \"姗\", \"褐\", \"嘟\", \"翰\", \"盎\", \"愣\", \"狐\", \"悚\", \"盒\", \"梭\", \"牟\", \"灰\", \"榻\", \"驮\", \"躬\", \"响\", \"喷\", \"守\", \"玫\", \"映\", \"桥\", \"〝\", \"蚯\", \"耳\", \"俩\", \"怠\", \"初\", \"茉\", \"瑒\", \"终\", \"黔\", \"毋\", \"尝\", \"砍\", \"垣\", \"致\", \"滋\", \"挤\", \"泳\", \"经\", \"慨\", \"追\", \"妖\", \"肺\", \"荣\", \"伴\", \"疮\", \"鹌\", \"笼\", \"督\", \"诊\", \"铜\", \"虫\", \"匠\", \"扛\", \"棋\", \"似\", \"姨\", \"牌\", \"赣\", \"撅\", \"吧\", \"叶\", \"介\", \"骰\", \"捧\", \"体\", \"?\", \"疼\", \"邻\", \"胎\", \"悉\", \"衣\", \"少\", \"庇\", \"份\", \"官\", \"蓟\", \" \", \"郸\", \"锄\", \"爻\", \"索\", \"逾\", \"醇\", \"垠\", \"壳\", \"庐\", \"十\", \"梦\", \"增\", \"沾\", \"渠\", \"饰\", \"Ø\", \"强\", \"窥\", \"迄\", \"翩\", \"辗\", \"蔚\", \"翠\", \"什\", \"朽\", \"陕\", \"咕\", \"凭\", \"身\", \"充\", \"懑\", \"驼\", \"暧\", \"旧\", \"箱\", \"翼\", \"缓\", \"隋\", \"闪\", \"疴\", \"歉\", \"窗\", \"草\", \"毒\", \"衔\", \"产\", \"止\", \"徘\", \"煌\", \"龙\", \"姚\", \"鹈\", \"筐\", \"放\", \"佼\", \"ὐ\", \"北\", \"镜\", \"胁\", \"去\", \"踵\", \"骆\", \"孽\", \"屡\", \"琴\", \"煤\", \"舐\", \"窃\", \"赋\", \"文\", \"冰\", \"蜴\", \"甜\", \"炙\", \"^\", \"幕\", \"不\", \"轮\", \"阵\", \"阔\", \"腥\", \"牡\", \"巅\", \"妥\", \"亟\", \"岌\", \"秋\", \"谩\", \"债\", \"怯\", \"械\", \"邵\", \"崇\", \"聒\", \"兼\", \"爆\", \"圣\", \"丧\", \"插\", \"穹\", \"天\", \"铣\", \"堵\", \"跤\", \"狂\", \"彗\", \"镳\", \"尖\", \"噱\", \"热\", \"汀\", \"半\", \"劝\", \"伦\", \"熟\", \"谴\", \"央\", \"奎\", \"+\", \"柚\", \"啥\", \"湾\", \"凤\", \"旭\", \"油\", \"敷\", \"瞥\", \"驰\", \"陷\", \"票\", \"兔\", \"操\", \"惕\", \"佰\", \"孀\", \"\\u0005\", \"作\", \"隆\", \"违\", \"喘\", \"A\", \"聿\", \"公\", \"蟀\", \"馍\", \"咐\", \"帝\", \"拇\", \"庆\", \"芝\", \"场\", \"竞\", \"瞻\", \"绑\", \"晟\", \"氮\", \"睡\", \"巢\", \"断\", \"诵\", \"盛\", \"咎\", \"距\", \"芳\", \"咯\", \"辆\", \"乘\", \"谀\", \"倏\", \"迟\", \"衫\", \"划\", \"←\", \"锅\", \"勃\", \"样\", \"光\", \"幅\", \"卷\", \"屯\", \"浦\", \"棵\", \"匙\", \"曼\", \"障\", \"芹\", \"观\", \"独\", \"嗣\", \"哟\", \"足\", \"悴\", \"弑\", \"洛\", \"缚\", \"洼\", \"弧\", \"流\", \"贼\", \"股\", \"犯\", \"破\", \"铸\", \"剑\", \"迪\", \"6\", \"气\", \"楔\", \"剂\", \"欸\", \"弹\", \"鼻\", \"歹\", \"寝\", \"1\", \"备\", \"洋\", \"椒\", \"鲜\", \"桌\", \"宏\", \"灌\", \"瘀\", \"a\", \"纾\", \"思\", \"褒\", \"恙\", \"饼\", \"屎\", \"趋\", \"腓\", \"渴\", \"狈\", \"难\", \"嚎\", \"钜\", \"9\", \"渎\", \"扑\", \"戚\", \"莲\", \"厦\", \"以\", \"抬\", \"铁\", \"毫\", \"层\", \"睽\", \"匹\", \"浠\", \"量\", \"悖\", \"如\", \"明\", \"藤\", \"两\", \"穿\", \"陇\", \"者\", \"徐\", \"昆\", \"屹\", \"特\", \"秽\", \"市\", \"犄\", \"谐\", \"冶\", \"肢\", \"腰\", \"眩\", \"判\", \"假\", \"著\", \"赵\", \"撰\", \"昏\", \"搬\", \"溺\", \"噴\", \"字\", \"铛\", \"耸\", \"⑩\", \"投\", \"廉\", \"道\", \"腭\", \"孝\", \"敬\", \"苒\", \"剐\", \"樟\", \"乒\", \"莘\", \"螃\", \"犬\", \"柯\", \"霄\", \"揭\", \"嘈\", \"旆\", \"蟹\", \"恒\", \"纬\", \"胶\", \"栅\", \"魇\", \"蜥\", \"巨\", \"杨\", \"。\", \"牙\", \"螺\", \"喉\", \"摆\", \"陛\", \"理\", \"毁\", \"于\", \"d\", \"昵\", \"憔\", \"差\", \"旎\", \"旌\", \"逛\", \"谜\", \"汇\", \"痕\", \"蜒\", \"翻\", \"弊\", \"辛\", \"\", \"妓\", \"兢\", \"棚\", \"绳\", \"炖\", \"躺\", \"邮\", \"懊\", \"孤\", \"绘\", \"吉\", \"乓\", \"诅\", \"巍\", \"却\", \"耗\", \"幻\", \"飘\", \"尬\", \"磺\", \"共\", \"然\", \"叙\", \"\\u0000\", \"霞\", \"健\", \"嗨\", \"D\", \"衷\", \"点\", \"孔\", \"辐\", \"午\", \"欲\", \"录\", \"缝\", \"摊\", \"匿\", \"结\", \"亡\", \"知\", \"班\", \"睿\", \"覃\", \"茜\", \"毎\", \"鹃\", \"亮\", \"霭\", \"鞠\", \"撷\", \"罪\", \"喽\", \"拐\", \"磕\", \"」\", \"隔\", \"夜\", \"撕\", \"审\", \"赠\", \"邹\", \"漲\", \"营\", \"宪\", \"蕃\", \"意\", \"赢\", \"嚣\", \"求\", \"\\\\\", \"问\", \"潇\", \"赘\", \"逑\", \"澄\", \"拣\", \"茅\", \"恣\", \"煜\", \"遁\", \"掏\", \"崽\", \"邯\", \"题\", \"永\", \"伽\", \"焚\", \"泊\", \"拖\", \"0\", \"秘\", \"甄\", \"侍\", \"刊\", \"苛\", \"础\", \"佘\", \"达\", \"掰\", \"挲\", \"〗\", \"麟\", \"谢\", \"の\", \"蛮\", \"斐\", \"陀\", \"款\", \"暖\", \"爽\", \"位\", \"酣\", \"党\", \"抑\", \"粼\", \"啼\", \"含\", \"遗\", \"超\", \"杀\", \"匈\", \"彬\", \"塑\", \"辑\", \"囊\", \"夺\", \"男\", \"需\", \"恨\", \"味\", \"瘦\", \"须\", \"兑\", \"橘\", \"朝\", \"读\", \"蹒\", \"褚\", \"馋\", \"支\", \"乏\", \"弃\", \"稻\", \"冀\", \"攻\", \"戸\", \"腻\", \"菜\", \"救\", \"坠\", \"盹\", \"羔\", \"犹\", \"粥\", \"榄\", \"砥\", \"默\", \"泻\", \"芽\", \"币\", \"帷\", \"伐\", \"符\", \"落\", \"径\", \"舎\", \"夷\", \"疑\", \"矮\", \"魔\", \"崖\", \"讦\", \"④\", \"丢\", \"拙\", \"研\", \"翕\", \"牠\", \"牒\", \"飙\", \"饨\", \"潮\", \"骤\", \"惹\", \"丑\", \"霊\", \"勘\", \"志\", \"较\", \"笛\", \"阑\", \"肋\", \"柑\", \"惯\", \"侬\", \"髦\", \"灶\", \"徙\", \"靓\", \"靶\", \"靖\", \"版\", \"釜\", \"垮\", \"炊\", \"挟\", \"於\", \"兜\", \"晚\", \"氨\", \"虚\", \"待\", \"配\", \"鸥\", \"设\", \"朵\", \"燃\", \"棉\", \"呗\", \"向\", \"职\", \"可\", \"负\", \"嘴\", \"瞧\", \"骛\", \"樯\", \"院\", \"稠\", \"咔\", \"垢\", \"宅\", \"砺\", \"讳\", \"蹊\", \"井\", \"汗\", \"黄\", \"靠\", \"诣\", \"嘛\", \"豁\", \"谣\", \"嘤\", \"严\", \"春\", \"睑\", \"骏\", \"颉\", \"与\", \"骸\", \"攀\", \"芷\", \"铝\", \"捐\", \"鹅\", \"送\", \"衍\", \"基\", \"很\", \"毕\", \"谓\", \"-\", \"偶\", \"莓\", \"粪\", \"坑\", \"耘\", \"鬼\", \"涤\", \"烦\", \"凯\", \"揣\", \"茏\", \"趁\", \"虔\", \"聋\", \"℃\", \"四\", \"疯\", \"瓷\", \"焙\", \"盲\", \"掩\", \"皆\", \"荧\", \"轴\", \"毡\", \"自\", \"延\", \"懵\", \"忪\", \"否\", \"踪\", \"罚\", \"纺\", \"捡\", \"7\", \"种\", \"圜\", \"力\", \"效\", \"茵\", \"序\", \"�\", \"硬\", \"蓁\", \"亦\", \"执\", \"铂\", \"瞩\", \"险\", \"肚\", \"属\", \"铨\", \"惴\", \"圈\", \"构\", \"乐\", \"萧\", \"琦\", \"豌\", \"倪\", \"珉\", \"嵘\", \"跌\", \"亂\", \"奏\", \"躇\", \"豹\", \"肤\", \"踢\", \"逝\", \"委\", \"鞍\", \"屏\", \"覆\", \"尧\", \"塘\", \"柄\", \"导\", \"器\", \"干\", \"圳\", \"\\b\", \"雀\", \"埂\", \"枣\", \"佛\", \"耻\", \"熄\", \"扶\", \"_\", \"厂\", \"郜\", \"汤\", \"勋\", \"我\", \"煎\", \"颖\", \"九\", \"蜜\", \"狭\", \"膝\", \"骇\", \"舟\", \"T\", \"皖\", \"伊\", \"账\", \"盯\", \"显\", \"秦\", \"通\", \"商\", \"儿\", \"屈\", \"蛇\", \"振\", \"俘\", \"瑄\", \"缀\", \"决\", \"柱\", \"坏\", \"⒌\", \"俱\", \"第\", \"吩\", \"铃\", \"家\", \"届\", \"鼎\", \"鬣\", \"瑢\", \"除\", \"过\", \"危\", \"链\", \"璀\", \"源\", \"改\", \"厄\", \"簿\", \"讨\", \"旱\", \"岣\", \"黯\", \"腊\", \"唠\", \"绅\", \"育\", \"剧\", \"溢\", \"私\", \"摔\", \"矍\", \"祷\", \"鼠\", \"游\", \"擦\", \"览\", \"疏\", \"棱\", \"洁\", \"祖\", \"就\", \"悄\", \"哗\", \"年\", \"茨\", \"抢\", \"灸\", \"N\", \"途\", \"恤\", \"寻\", \"咪\", \"©\", \"苹\", \"膛\", \"他\", \"萨\", \"镑\", \"云\", \"嗡\", \"阿\", \"噢\", \"扬\", \"锯\", \"仅\", \"迁\", \"钻\", \"卧\", \"涟\", \"尸\", \"要\", \"擀\", \"金\", \"呦\", \"估\", \"值\", \"雄\", \"辫\", \"矢\", \"任\", \"仍\", \"岛\", \"坚\", \"拷\", \"漫\", \"饶\", \"昕\", \"愕\", \"莺\", \"绊\", \"暨\", \"一\", \"奘\", \"糖\", \"驱\", \"击\", \"慮\", \"貌\", \"晓\", \"锁\", \"谷\", \"厮\", \"枉\", \"纷\", \"法\", \"婶\", \"方\", \"纲\", \"渺\", \"劲\", \"涅\", \"将\", \"潜\", \"受\", \"扪\", \"或\", \"快\", \"锌\", \"V\", \"骁\", \"幸\", \"写\", \"博\", \"补\", \"夕\", \"匾\", \"氧\", \"迫\", \"唐\", \"荷\", \"校\", \"岗\", \"缄\", \"亩\", \"伞\", \"巳\", \"遢\", \"卿\", \"己\", \"困\", \"珍\", \"丐\", \"馆\", \"抵\", \"跑\", \"入\", \"怀\", \"交\", \"函\", \"叼\", \"律\", \"宝\", \"惋\", \"狳\", \"乍\", \"伏\", \"挎\", \"姥\", \"蚓\", \"绽\", \"辈\", \"捷\", \"桶\", \"3\", \"计\", \"砧\", \"碳\", \"陋\", \"冻\", \"峰\", \"牧\", \"琉\", \"鞘\", \"涡\", \"礼\", \"革\", \"欺\", \"瞎\", \"丹\", \"矩\", \"枪\", \"郝\", \"楷\", \"希\", \"猪\", \"集\", \"淅\", \"番\", \"钉\", \"⑿\", \"欠\", \"胫\", \"祢\", \"它\", \"爪\", \"瞳\", \"瓣\", \"报\", \"诚\", \"眉\", \"燥\", \"号\", \"骼\", \"遵\", \"雾\", \"纽\", \"亿\", \"尹\", \"\", \"沼\", \"叭\", \"抱\", \"荼\", \"户\", \"阱\", \"シ\", \"戏\", \"黢\", \"愚\", \"友\", \"鼾\", \"凡\", \"爰\", \"洽\", \"蔓\", \"酵\", \"免\", \"靡\", \"觉\", \"和\", \"预\", \"娄\", \"暇\", \"周\", \"躲\", \"漱\", \"羹\", \"剥\", \"脂\", \"回\", \"簇\", \"抖\", \"喃\", \"千\", \"惘\", \"奢\", \"黎\", \"爷\", \"賣\", \"娇\", \"媒\", \"鄂\", \"陨\", \"猾\", \"菌\", \"啬\", \"铲\", \"唬\", \"颇\", \"林\", \"瀚\", \"璃\", \"利\", \"矶\", \"剁\", \"帅\", \"韩\", \"度\", \"弟\", \"s\", \"蓬\", \"岂\", \"说\", \"蜘\", \"鸟\", \"拘\", \"述\", \"兹\", \"浓\", \"清\", \"辽\", \"碰\", \"艺\", \"查\", \"淘\", \"摄\", \"霉\", \"农\", \"起\", \"玻\", \"侥\", \"界\", \"盼\", \"確\", \"屑\", \"济\", \"扰\", \"隧\", \"舒\", \"歧\", \"哉\", \"辙\", \"蕉\", \"鼯\", \"聘\", \"极\", \"缸\", \"屣\", \"睫\", \"译\", \"谁\", \"摸\", \"渝\", \"淳\", \"馁\", \"觑\", \"朦\", \"雳\", \"涕\", \"葩\", \"掠\", \"靛\", \"付\", \"豚\", \"为\", \"昊\", \"邀\", \"铤\", \"渥\", \"倦\", \"甩\", \"窘\", \"俏\", \"妆\", \"贾\", \"〈\", \"摞\", \"霸\", \"唱\", \"再\", \"<\", \"蟋\", \"郴\", \"徇\", \"异\", \"子\", \"会\", \"数\", \"苣\", \"抽\", \"避\", \"肯\", \"岸\", \"怒\", \"唇\", \"范\", \"札\", \"狞\", \"乳\", \"羽\", \"巷\", \"粹\", \"蛔\", \"铄\", \"处\", \"杠\", \"椰\", \"勒\", \"率\", \"擎\", \"优\", \"嚼\", \"解\", \"牛\", \"凿\", \"飞\", \"悲\", \"逗\", \"烂\", \"吓\", \"竿\", \"抠\", \"穰\", \"原\", \"州\", \"奔\", \"巫\", \"璨\", \"刷\", \"嗜\", \"へ\", \"安\", \"忧\", \"妇\", \"伤\", \"碎\", \"胚\", \"篱\", \"⑷\", \"贿\", \"犟\", \"渊\", \"诗\", \"乙\", \"婊\", \"绒\", \"疤\", \"胸\", \"搁\", \"课\", \"欧\", \"扳\", \"旁\", \"邦\", \"◆\", \"斋\", \"丙\", \"挑\", \"瞰\", \"失\", \"各\", \"晶\", \"怡\", \"窖\", \"呀\", \"壕\", \"做\", \"r\", \"峭\", \"销\", \"皇\", \"列\", \"阜\", \"珊\", \"麾\", \"被\", \"稍\", \"外\", \"痴\", \"阂\", \"裔\", \"胀\", \"李\", \"论\", \"首\", \"α\", \"怵\", \"曳\", \"防\", \"灭\", \"霆\", \"纹\", \"洗\", \"8\", \"纯\", \"潦\", \"鹦\", \"绪\", \"步\", \"慰\", \"汛\", \"露\", \"沫\", \"苍\", \"颤\", \"壑\", \"诃\", \"捉\", \"短\", \"酝\", \"赖\", \"涛\", \"\\u0006\", \"睁\", \"蔼\", \"鹤\", \"2\", \"芭\", \"缔\", \"阐\", \" \", \"厅\", \"庸\", \"祈\", \"把\", \"医\", \"~\", \"品\", \"〉\", \"犁\", \"芋\", \"沐\", \"辰\", \"盗\", \"黝\", \"鸩\", \"早\", \"勤\", \"披\", \"线\", \"乎\", \"耕\", \"栋\", \"躁\", \"坂\", \"嫩\", \"讥\", \"裴\", \"琳\", \"溜\", \"俪\", \"舵\", \"蜃\", \"⑧\", \"另\", \"椎\", \"环\", \"潘\", \"址\", \"胳\", \"鲤\", \"拂\", \"柜\", \"帖\", \"灯\", \"韵\", \"抹\", \"卢\", \"瘤\", \"眷\", \"楞\", \"龄\", \"湖\", \")\", \"凸\", \"齿\", \"袭\", \"荻\", \"底\", \"窝\", \"闾\", \"留\", \"暮\", \"诸\", \"姆\", \"亳\", \"室\", \"豆\", \"浩\", \"则\", \"成\", \"具\", \"惊\", \"眠\", \"麦\", \"拽\", \"炮\", \"悯\", \"败\", \"菲\", \"倚\", \"伍\", \"蹴\", \"谛\", \"妹\", \"糊\", \"活\", \"姑\", \"擤\", \"ς\", \"③\", \"琐\", \"沥\", \"沽\", \"橇\", \"别\", \"锲\", \"赃\", \"噼\", \"鸠\", \"罄\", \"門\", \"魄\", \"搅\", \"資\", \"捍\", \"暄\", \"丁\", \"淌\", \"仁\", \"激\", \"臆\", \"泥\", \"立\", \"榆\", \"迷\", \"筒\", \"碱\", \"厢\", \"抒\", \"皱\", \"到\", \"漪\", \"嘣\", \"恺\", \"糯\", \"煲\", \"蔑\", \"肘\", \"刑\", \"羞\", \"栈\", \"壤\", \"平\", \"傻\", \"寰\", \"馕\", \"損\", \"籁\", \"杰\", \"臣\", \"诩\", \"娜\", \"別\", \"画\", \"睛\", \"晒\", \"啡\", \"趟\", \"套\", \"沈\", \"弯\", \"扔\", \"戒\", \"耽\", \"澜\", \"昧\", \"啕\", \"淤\", \"墙\", \"槽\", \"剿\", \"烧\", \"湿\", \"恃\", \"淋\", \"磅\", \"钧\", \"角\", \"降\", \"害\", \"嗲\", \"淼\", \"涵\", \"栽\", \"脸\", \"臭\", \"五\", \"引\", \"袍\", \"来\", \"锤\", \"畑\", \"讪\", \"忿\", \"疵\", \"ズ\", \"氢\", \"适\", \"蒙\", \"暹\", \"倍\", \"玛\", \"讲\", \"之\", \"球\", \"揖\", \"瓦\", \"舞\", \"髓\", \"歪\", \"堂\", \"卻\", \"妮\", \"垃\", \"馒\", \"园\", \"俑\", \"秒\", \"腋\", \"耍\", \"槛\", \"码\", \"厕\", \"空\", \"赞\", \"動\", \"才\", \"斧\", \"翅\", \"臀\", \"跨\", \"蔽\", \"炭\", \"竖\", \"兵\", \"针\", \"贝\", \"橄\", \"肇\", \"袜\", \"羚\", \"墓\", \"邕\", \"選\", \"赔\", \"批\", \"上\", \"绞\", \"洒\", \"拨\", \"衰\", \"扎\", \"忘\", \"洲\", \"香\", \"侵\", \"客\", \"移\", \"泾\", \"\", \"墉\", \"吭\", \"枚\", \"疲\", \"帽\", \"玩\", \"娘\", \"迅\", \"拒\", \"栗\", \"屉\", \"颧\", \"卸\", \"锏\", \"屁\", \"踹\", \"稽\", \"阪\", \"龚\", \"架\", \"涣\", \"标\", \"颂\", \"碑\", \"刀\", \"熙\", \"泪\", \"貂\", \"篡\", \"偏\", \"维\", \"羡\", \"涌\", \"铩\", \"吏\", \"苟\", \"贡\", \"%\", \"佐\", \"旳\", \"借\", \"眺\", \"祀\", \"每\", \"辞\", \"选\", \"傍\", \"控\", \"彪\", \"钝\", \"ο\", \"几\", \"萤\", \"停\", \"乃\", \"反\", \"津\", \"诉\", \"召\", \"信\", \"置\", \"萌\", \"溯\", \"嚷\", \"坦\", \"瑧\", \"约\", \"癜\", \"`\", \"耐\", \"炳\", \"植\", \"噩\", \"台\", \"脑\", \"绉\", \"孕\", \"娴\", \"站\", \"诈\", \"焦\", \"谧\", \"檬\", \"笔\", \"轨\", \"饽\", \"兽\", \"瘩\", \"始\", \"凰\", \"夏\", \"助\", \"扣\", \"锂\", \"区\", \"捂\", \"芬\", \"肮\", \"闯\", \"哮\", \"背\", \"藏\", \"怕\", \"胱\", \"▲\", \"诠\", \"瞟\", \"刁\", \"桢\", \"同\", \"工\", \"吊\", \"叠\", \"窍\", \"霍\", \"朗\", \"瀑\", \"炉\", \"斌\", \"炅\", \"白\", \"梵\", \"岑\", \"攸\", \"涉\", \"晰\", \"刚\", \"蝉\", \"望\", \"冽\", \"怖\", \"攥\", \"纤\", \"琛\", \"杉\", \"牖\", \"租\", \"苯\", \"裆\", \"拟\", \"戢\", \"颠\", \"噬\", \"侈\", \"稀\", \"散\", \"兴\", \"篷\", \"硕\", \"玉\", \"漠\", \"凝\", \"纪\", \"肉\", \"崛\", \"释\", \"浇\", \"哒\", \"伫\", \"畜\", \"溪\", \"囤\", \"掀\", \"悠\", \"唯\", \"银\", \"嘱\", \"滑\", \"认\", \"咳\", \"鸦\", \"宙\", \"}\", \"雌\", \"蚪\", \"楣\", \"象\", \"匆\", \"参\", \"麻\", \"琅\", \"略\", \"堕\", \"漓\", \"森\", \"柳\", \"料\", \"虽\", \"先\", \"呆\", \"浴\", \"俨\", \"鄯\", \"恰\", \"镉\", \"欢\", \"殉\", \"新\", \"办\", \"臂\", \"生\", \"惟\", \"扼\", \"南\", \"涩\", \"珞\", \"迹\", \"跻\", \"兄\", \"攒\", \"舛\", \"诟\", \"臊\", \"踏\", \"遂\", \"《\", \"减\", \"\", \"掐\", \"尽\", \"哀\", \"圩\", \"出\", \"合\", \"墒\", \"确\", \"栾\", \"割\", \"恿\", \"且\", \"政\", \"状\", \"仲\", \"沸\", \"畅\", \"砾\", \"甬\", \"殆\", \"昔\", \"炼\", \"芜\", \"亲\", \"非\", \"秉\", \"俺\", \"征\", \"耦\", \"運\", \"猝\", \"珠\", \"蹭\", \"贤\", \"哑\", \"誉\", \"纰\", \"眶\", \"荡\", \"单\", \"悼\", \"篇\", \"笑\", \"车\", \"陌\", \"倾\", \"扮\", \"搏\", \"醛\", \"们\", \"卫\", \"渣\", \"壹\", \"赡\", \"俊\", \"爱\", \"舍\", \"翁\", \"孵\", \"滞\", \"尾\", \"妞\", \"咬\", \"珀\", \"购\", \"型\", \"乱\", \"晕\", \"棂\", \"愧\", \"诧\", \"蛋\", \"勖\", \"裸\", \"宛\", \"房\", \"栩\", \"膀\", \"轩\", \"裕\", \"仑\", \"售\", \"扒\", \"腔\", \"末\", \"水\", \"偎\", \"π\", \"漉\", \"電\", \"煮\", \"採\", \"坟\", \"傅\", \"重\", \"\", \"施\", \"口\", \"载\", \"炸\", \"锋\", \"裳\", \"姜\", \"呕\", \"娛\", \"逊\", \"竟\", \"叩\", \"葬\", \"⑦\", \"堤\", \"併\", \"狼\", \"升\", \"爵\", \"务\", \"块\", \"谍\", \"诲\", \"溶\", \"暑\", \"税\", \"莴\", \"遥\", \"犀\", \"價\", \"燕\", \"句\", \"蛛\", \"睦\", \"丘\", \"山\", \"曙\", \"偷\", \"泵\", \";\", \"肝\", \"垂\", \"名\", \"肃\", \"舆\", \"谬\", \"提\", \"军\", \"撞\", \"久\", \"劾\", \"梢\", \"疗\", \"契\", \"互\", \"削\", \"凛\", \"锚\", \"宇\", \"策\", \"瑨\", \"炎\", \"∶\", \"蘑\", \"孰\", \"碟\", \"编\", \"蒜\", \"徨\", \"粕\", \"格\", \"篓\", \"灵\", \"蹈\", \"愈\", \"猡\", \"ㄓ\", \"巩\", \"虑\", \"个\", \"棘\", \"缪\", \"咏\", \"没\", \"贷\", \"舅\", \"悔\", \"厥\", \"船\", \"石\", \"弈\", \"帜\", \"低\", \"动\", \"奸\", \"相\", \"狗\", \"左\", \"胧\", \"骅\", \"盾\", \"艰\", \"×\", \"呜\", \"浞\", \"咆\", \"矛\", \"晖\", \"熹\", \"驶\", \"敢\", \"夥\", \"转\", \"乔\", \"宠\", \"习\", \"寞\", \"桩\", \"驿\", \"积\", \"癌\", \"都\", \"泛\", \"奈\", \"喧\", \"夯\", \"寅\", \"茎\", \"茸\", \"脾\", \"踌\", \"捏\", \"翘\", \"鞭\", \"卡\", \"漏\", \"烈\", \"媲\", \"剖\", \"古\", \"广\", \"■\", \"磨\", \"郑\", \"赛\", \"锒\", \"艾\", \"忙\", \"弥\", \"墨\", \"嗔\", \"监\", \"贺\", \"哼\", \"叹\", \"梧\", \"晃\", \"桑\", \"摩\", \"膊\", \"辅\", \"慈\", \"滇\", \"崔\", \"弘\", \"挫\", \"饷\", \"英\", \"钊\", \"倘\", \"勉\", \"呃\", \"孪\", \"衅\", \"烃\", \"胆\", \"精\", \"淞\", \"坎\", \"造\", \"酷\", \"、\", \"扁\", \"雨\", \"触\", \"町\", \"溃\", \"糕\", \"搂\", \"蹄\", \"蜷\", \"涨\", \"棒\", \"凳\", \"居\", \"池\", \"蝗\", \"瞬\", \"义\", \"梳\", \"亨\", \"臃\", \"呢\", \"栏\", \"吼\", \"冉\", \"床\", \"茁\", \"恶\", \"硅\", \"笆\", \"援\", \"媚\", \"综\", \"俯\", \"讷\", \"滨\", \"净\", \"秤\", \"直\", \"阴\", \"谦\", \"棣\", \"弓\", \"后\", \"蠢\", \"锐\", \"正\", \"替\", \"规\", \"葵\", \"语\", \"奋\", \"鳌\", \"妙\", \"爸\", \"暂\", \"毅\", \"薄\", \"描\", \"椅\", \"蚂\", \"装\", \"劫\", \"報\", \"恼\", \"鸡\", \"僵\", \"觅\", \"磋\", \"钓\", \"老\", \"\", \"喱\", \"窟\", \"诺\", \"供\", \"感\", \"亚\", \"宵\", \"苗\", \"喻\", \"让\", \"徒\", \"骄\", \"枯\", \"撼\", \"喆\", \"赂\", \"兰\", \"夹\", \"街\", \"麽\", \"猛\", \"纵\", \"铮\", \"涝\", \"邋\", \"烫\", \"忐\", \"授\", \"⑴\", \"樊\", \"鑫\", \"收\", \"飕\", \"寓\", \"火\", \"怔\", \"酸\", \"采\", \"遛\", \"季\", \"况\", \"警\", \"嬉\", \"组\", \"货\", \"慎\", \"纠\", \"敌\", \"玳\", \"胡\", \"够\", \"织\", \"俭\", \"廖\", \"彼\", \"土\", \"惧\", \"妤\", \"俗\", \"撤\", \"寿\", \"价\", \"哎\", \"〃\", \"骑\", \"钱\", \"看\", \"(\", \"指\", \"能\", \"沧\", \"村\", \"淖\", \"呻\", \"常\", \"皈\", \"喝\", \"吕\", \"亥\", \"拍\", \"权\", \"涸\", \"坤\", \"万\", \"翱\", \"茱\", \"愿\", \" \", \"檀\", \"血\", \"後\", \"肪\", \"奴\", \"戮\", \"涯\", \"汹\", \"發\", \"氰\", \"必\", \"均\", \"无\", \"食\", \"摒\", \"署\", \"辨\", \"湮\", \"摘\", \"妊\", \"─\", \"跋\", \"贮\", \"煽\", \"路\", \"鹏\", \"鄙\", \"兮\", \"宽\", \"言\", \"带\", \"访\", \"踱\", \"峨\", \"茄\", \"仕\", \"庄\", \"急\", \"浆\", \"舶\", \"桓\", \"进\", \"循\", \"稳\", \"劈\", \"普\", \"侯\", \"颐\", \"边\", \"肥\", \"陶\", \"婴\", \"兆\", \"御\", \"辩\", \"朔\", \"柠\", \"乖\", \"长\", \"韧\", \"哭\", \"钮\", \"谅\", \"逍\", \"酥\", \"虏\", \"豫\", \"淮\", \"栓\", \"侃\", \"尚\", \"囚\", \"蚌\", \"糟\", \"议\", \"扯\", \"苦\", \"嘿\", \"恭\", \"挨\", \"澈\", \"夸\", \"埠\", \"抉\", \"壓\", \"熔\", \"鹜\", \"{\", \"疹\", \"评\", \"好\", \"木\", \"嵌\", \"菊\", \"痛\", \"拢\", \"敖\", \"择\", \"勇\", \"琶\", \"温\", \"敞\", \"脐\", \"罹\", \"社\", \"岁\", \"战\", \"但\", \"只\", \"沂\", \"忑\", \"襄\", \"临\", \"梅\", \"色\", \"咚\", \"桐\", \"僧\", \"痒\", \"虹\", \"想\", \"询\", \"电\", \"音\", \"缴\", \"图\", \"比\", \"懈\", \"伪\", \"类\", \"至\", \"窒\", \"夫\", \"鼓\", \"舰\", \"诫\", \"伉\", \"亭\", \"曾\", \"揉\", \"茂\", \"皙\", \"旷\", \"突\", \"丫\", \"准\", \"肆\", \"拦\", \"是\", \"狮\", \"滓\", \"棠\", \"腱\", \"襟\", \"唆\", \"虞\", \"斗\", \"该\", \"妻\", \"满\", \"命\", \"誓\", \"掳\", \"内\", \"缭\", \"猴\", \"淀\", \"畔\", \"徊\", \"绸\", \"疫\", \"瑥\", \"探\", \"丝\", \"镶\", \"镕\", \"逢\", \"趴\", \"坝\", \"馅\", \"也\", \"蚀\", \"狩\", \"歌\", \"啪\", \"聂\", \"演\", \"析\", \"骚\", \"谈\", \"沓\", \"蜕\", \"病\", \"胰\", \"蚁\", \"婺\", \"蝇\", \"甸\", \"矿\", \"吾\", \"裘\", \"摇\", \"悍\", \"槿\", \"喂\", \"浊\", \"墟\", \"祉\", \"霓\", \"浪\", \"抗\", \"绷\", \"隙\", \"前\", \"唉\", \"剔\", \"曹\", \"》\", \"缺\", \"唤\", \"涂\", \"⒃\", \"伯\", \"式\", \"奚\", \"稚\", \"碗\", \"桃\", \"妄\", \"磊\", \"板\", \"慷\", \"群\", \"财\", \"混\", \"嘭\", \"i\", \"韦\", \"染\", \"穆\", \"淹\", \"葡\", \"朱\", \"叛\", \"保\", \"董\", \"瞄\", \"箍\", \"端\", \"粘\", \"袋\", \"萼\", \"澳\", \"婪\", \"启\", \"刺\", \"胃\", \"梗\", \"灑\", \"锦\", \"武\", \"固\", \"玄\", \"禾\", \"材\", \"斜\", \"踊\", \"籍\", \"拉\", \"弛\", \"播\", \"猎\", \"搀\", \"榷\", \"程\", \"禁\", \"允\", \"射\", \"坛\", \"槃\", \"缮\", \"郎\", \"殷\", \"瘙\", \"漆\", \"祭\", \"號\", \"惠\", \"据\", \"憾\", \"矫\", \"沁\", \"钵\", \"遭\", \"还\", \"嗅\", \"瓢\", \"褂\", \"浅\", \"宗\", \"吁\", \"艘\", \"砌\", \"您\", \"肴\", \"抡\", \"鹿\", \"豪\", \"捕\", \"咖\", \"薯\", \"郡\", \"逆\", \"日\", \"传\", \"吹\", \"寺\", \"贸\", \"歇\", \"颜\", \"归\", \"秆\", \"江\", \"礁\", \"惶\", \"勾\", \"侨\", \"惫\", \"甚\", \"沮\", \"ě\", \"莫\", \"美\", \"婚\", \"迭\", \"鹑\", \"竺\", \"斑\", \"慕\", \"枕\", \"柬\", \"携\", \"企\", \"爹\", \"孱\", \"腑\", \"戈\", \"协\", \"梨\", \"梯\", \"跷\", \"蜡\", \"柿\", \"吵\", \"盏\", \"蒿\", \"筋\", \"情\", \"遑\", \"典\", \"此\", \"良\", \"宜\", \"馈\", \"若\", \"误\", \"颓\", \"阅\", \"谚\", \"关\", \"耿\", \"迎\", \"壁\", \"坪\", \"遣\", \"挡\", \"华\", \"砂\", \"闫\", \"打\", \"肖\", \"专\", \"盐\", \"纳\", \"噪\", \"汰\", \"艇\", \"屄\", \"烯\", \"俚\", \"拭\", \"翔\", \"模\", \"全\", \"绩\", \"②\", \"额\", \"铭\", \"隶\", \"叔\", \"撩\", \"仆\", \"橱\", \"時\", \"楠\", \"省\", \"昂\", \"辣\", \"筹\", \"纸\", \"订\", \"扩\", \"瘫\", \"绿\", \"慧\", \"⒂\", \"廓\", \"殊\", \"酬\", \"曝\", \"鸣\", \"焯\", \"哈\", \"骗\", \"郁\", \"疆\", \"厉\", \"寡\", \"イ\", \"冷\", \"脏\", \"缅\", \"芯\", \"予\", \"窦\", \"卦\", \"蚤\", \"攫\", \"总\", \"挪\", \"揪\", \"赐\", \"傥\", \"罐\", \"吗\", \"熊\", \"持\", \"鲸\", \"僻\", \"铺\", \"圾\", \"嗪\", \"究\", \"乞\", \"娃\", \"踝\", \"屿\", \"戛\", \"殴\", \"化\", \"候\", \"贞\", \"走\", \"泸\", \"吞\", \"熏\", \"宫\", \"蘸\", \"/\", \"驻\", \"损\", \"滕\", \"雁\", \"父\", \"掉\", \"期\", \"哦\", \"发\", \"寒\", \"污\", \"愁\", \"凋\", \"淑\", \"次\", \"[\", \"簧\", \"拥\", \"海\", \"岔\", \"纨\", \"颊\", \"咙\", \"匕\", \"大\", \"衡\", \"闺\", \"诙\", \"取\", \"绥\", \"碌\", \"欣\", \"更\", \"赶\", \"灼\", \"祝\", \"档\", \"盘\", \"淄\", \"\\u0007\", \"刨\", \"吻\", \"芮\", \"沙\", \"鳃\", \"荐\", \"展\", \"侄\", \"旗\", \"滥\", \"寇\", \"变\", \"卜\", \"拧\", \"辖\", \"浮\", \"撸\", \"缈\", \"岳\", \"]\", \"遏\", \"淆\", \"砖\", \"塔\", \"哄\", \"沦\", \"琢\", \"醉\", \"荏\", \"刻\", \"敏\", \"片\", \"胞\", \"夭\", \"阮\", \"晗\", \"毙\", \"烁\", \"拾\", \"厝\", \"性\", \"续\", \"炬\", \"饱\", \"定\", \"甫\", \"科\", \"给\", \"冬\", \"舱\", \"狙\", \"穴\", \"称\", \"扭\", \"密\", \"仿\", \"握\", \"疚\", \"粗\", \"分\", \"泼\", \"横\", \"員\", \"举\", \"错\", \"蹿\", \"抚\", \"甘\", \"並\", \"遐\", \"仪\", \"沟\", \"暗\", \"晋\", \"掺\", \"坐\", \"卓\", \"莱\", \"肾\", \"滩\", \"莹\", \"婷\", \"腕\", \"岱\", \"并\", \"嫉\", \"惑\", \"榭\", \"猬\", \"瑕\", \"仰\", \"4\", \"势\", \"寸\", \"恕\", \"伺\", \"元\", \"韪\", \"娑\", \"换\", \"轼\", \"瞅\", \"奂\", \"個\", \"逻\", \"鸽\", \"畏\", \"盆\", \"翌\", \"闵\", \"坞\", \"繁\", \"峙\", \"垛\", \"姊\", \"臻\", \"掘\", \"祸\", \"帮\", \"淫\", \"掷\", \"驭\", \"案\", \"着\", \"敲\", \"霾\", \"h\", \"双\", \"轶\", \"肠\", \"妍\", \"唏\", \"京\", \"逸\", \"听\", \"檐\", \"隘\", \"啊\", \"恍\", \"间\", \"莞\", \"荤\", \"赫\", \"肌\", \"阶\", \"滴\", \"迩\", \"印\", \"○\", \"篝\", \"扫\", \"冒\", \"毗\", \"薪\", \"缠\", \"讽\", \"诞\", \"璇\", \"宾\", \"啐\", \"郭\", \"心\", \"腹\", \"咒\", \"饲\", \"胖\", \"璎\", \"榨\", \"舔\", \"鹕\", \"憬\", \"婿\", \"楚\", \"越\", \"詹\", \"橙\", \"岩\", \"资\", \"烷\", \"钢\", \"谊\", \"郅\", \"紫\", \"猩\", \"沪\", \"镍\", \"切\", \"蔡\", \"钰\", \"倩\", \"像\", \"贯\", \"姐\", \"肛\", \"▪\", \"憋\", \"阎\", \"注\", \"姬\", \"汉\", \"乾\", \"费\", \"运\", \"枝\", \"膏\", \"澡\", \"窄\", \"嗯\", \"芒\", \"粉\", \"啦\", \"殖\", \"复\", \"恋\", \"从\", \"搐\", \"琼\", \"寂\", \"静\", \"连\", \"狰\", \"咧\", \"帐\", \"藉\", \"屌\", \"闷\", \"痹\", \"僚\", \"技\", \"渔\", \"畿\", \"顾\", \"腐\", \"ソ\", \"虾\", \"霏\", \"酌\", \"仓\", \"岭\", \"缜\", \"绛\", \"〕\", \"颗\", \"拿\", \"月\", \"奥\", \"章\", \"滔\", \"骂\", \"休\", \"蕴\", \"萄\", \"佩\", \"魂\", \"舀\", \"惰\", \"境\", \"ノ\", \"高\", \"晦\", \"阁\", \"惭\", \"随\", \"抓\", \"浑\", \"礴\", \"捺\", \"简\", \"孟\", \"匮\", \"ト\", \"奖\", \"加\", \"黛\", \"态\", \"谨\", \"哨\", \"汶\", \"波\", \"创\", \"昨\", \"震\", \"患\", \"捅\", \"已\", \"璧\", \"尉\", \"磁\", \"顷\", \"鲨\", \"右\", \"灾\", \"碾\", \"桦\", \"管\", \"匀\", \"顽\", \"劣\", \"·\", \"艳\", \"锣\", \"庶\", \"浸\", \"献\", \"撇\", \"庞\", \"宋\", \"譬\", \"吠\", \"脖\", \"逃\", \"顶\", \"申\", \"君\", \"铎\", \"忡\", \"赚\", \"阳\", \"师\", \"狠\", \"拓\", \"萎\", \"薰\", \"菩\", \"使\", \"雷\", \"迦\", \"曰\", \"应\", \"氯\", \"赁\", \"招\", \"席\", \"泡\", \"搭\", \"锈\", \"拔\", \"馏\", \"攘\", \"韫\", \"宴\", \"啃\", \"疙\", \"娩\", \"筑\", \"恐\", \"盟\", \"斤\", \"排\", \"凌\", \"焉\", \"寐\", \"絮\", \"绚\", \"鹉\", \"券\", \"遇\", \"湛\", \"莉\", \"妒\", \"历\", \"侠\", \"缕\", \"趣\", \"颁\", \"佝\", \"焕\", \"炝\", \"局\", \"所\", \"棕\", \"仙\", \"莅\", \"锢\", \"艋\", \"奇\", \"o\", \"彤\", \"稣\", \"弩\", \"死\", \"沏\", \"整\", \"旨\", \"娶\", \"买\", \"田\", \"谆\", \"侦\", \"瑟\", \"忍\", \"鸿\", \"潢\", \"娥\", \"倡\", \"航\", \"跚\", \"瑑\", \"团\", \"慢\", \"※\", \"佳\", \"蹲\", \"葛\", \"犷\", \"般\", \"拱\", \"你\", \"讯\", \"尿\", \"尼\", \"段\", \"裁\", \"答\", \"杯\", \"试\", \"睬\", \"嗤\", \"废\", \"雕\", \"撑\", \"养\", \"缘\", \"吸\", \"亏\", \"奉\", \"野\", \"胜\", \"诬\", \"斛\", \"邱\", \"韬\", \"犰\", \"娠\", \"烙\", \"绰\", \"苏\", \"e\", \"昭\", \"嫖\", \"最\", \"寨\", \"鲍\", \"歩\", \"饿\", \"斥\", \"柏\", \"贩\", \"捆\", \"太\", \"弄\", \"富\", \"康\", \"魅\", \"吟\", \"昌\", \"嗦\", \"烊\", \"痪\", \"罔\", \"捞\", \"煞\", \"获\", \"呼\", \"隐\", \"倜\", \"闲\", \"丛\", \"旬\", \"焊\", \"菱\", \"缆\", \"烹\", \"输\", \"』\", \"伙\", \"联\", \"勺\", \"丈\", \"弱\", \"蒋\", \"坡\", \"傲\", \":\", \"肓\", \"钞\", \"悬\", \"掬\", \"幽\", \"驾\", \"那\", \"绵\", \"签\", \"穗\", \"手\", \"溉\", \"摹\", \"拆\", \"瞪\", \"世\", \"薛\", \"硫\", \"绕\", \"衿\", \"些\", \"储\", \"巾\", \"罢\", \"益\", \"!\", \"啜\", \"人\", \"垫\", \"粽\", \"网\", \"篢\", \"慑\", \"丰\", \"绎\", \"忽\", \"暴\", \"微\", \"擅\", \"抨\", \"叫\", \"株\", \"丸\", \"幢\", \"蝶\", \"劳\", \"条\", \"↑\", \"拗\", \"汝\", \"岖\", \"逶\", \"娟\", \"蒸\", \"粮\", \"奠\", \"紊\", \"绝\", \"璜\", \"羁\", \"士\", \"哇\", \"藕\", \"渤\", \"卖\", \"封\", \"濮\", \"堡\", \"橡\", \"胺\", \"啸\", \"饭\", \"徳\", \"蜿\", \"玮\", \"埔\", \"溅\", \"诡\", \"深\", \"便\", \"碍\", \"渲\", \"『\", \"膜\", \"邂\", \"巧\", \"肩\", \"馄\", \"善\", \"醒\", \"彦\", \"腺\", \"汲\", \"噶\", \"涮\", \"餐\", \"秃\", \"住\", \"挖\", \"花\", \"吨\", \"妨\", \"泣\", \"拜\", \"堰\", \"妃\", \"镇\", \"峻\", \"事\", \"眯\", \"晨\", \"宿\", \"彭\", \"领\", \"阻\", \"许\", \"峡\", \"素\", \"虱\", \"穷\", \"唾\", \"赤\", \"渍\", \"按\", \"晤\", \"秸\", \"邢\", \"抄\", \"⑶\", \"吝\", \"廷\", \"鞋\", \"挝\", \"蓉\", \"猫\", \"彷\", \"伟\", \"圭\", \"登\", \"键\", \"消\", \"泽\", \"照\", \"实\", \"湃\", \"籽\", \"烟\", \"懒\", \"汁\", \"咋\", \"面\", \"主\", \"酪\", \"柴\", \"往\", \"乡\", \"详\", \"功\", \"淇\", \"逼\", \"柔\", \"讼\", \"牢\", \"仗\", \"荒\", \"筝\", \"烤\", \"宰\", \"藐\", \"中\", \"措\", \"〞\", \"龇\", \"敝\", \"尘\", \"偌\", \"里\", \"搜\", \"芙\", \"厚\", \"★\", \"孩\", \"请\", \"责\", \"娱\", \"仔\", \"钟\", \"槐\", \"郊\", \"卤\", \"滤\", \"用\", \"星\", \"袁\", \"偻\", \"瓶\", \"饵\", \"易\", \"慌\", \"託\", \"菁\", \"真\", \"鳞\", \"细\", \"速\", \"既\", \"齐\", \"港\", \"寄\", \"熨\", \"彰\", \"髻\", \"纂\", \"笨\", \"镐\", \"孙\", \"焰\", \"酱\", \"羊\", \"六\", \"刃\", \"谑\", \"二\", \"邸\", \"膳\", \"对\", \"目\", \"瑞\", \"测\", \"溘\", \"压\", \"果\", \"景\", \"尺\", \"脉\", \"哲\", \"瞒\", \"擂\", \"何\", \"遮\", \"ό\", \"叮\", \"狡\", \"塞\", \"垄\", \"浚\", \"茧\", \"呛\", \"迤\", \"而\", \"苑\", \"⑤\", \"醍\", \"堆\", \"秩\", \"扇\", \"棺\", \"稿\", \"佣\", \"瓜\", \"鹭\", \"儒\", \"框\", \"塌\", \"践\", \"赎\", \"彩\", \"轿\", \"晾\", \"时\", \"递\", \"贪\", \"在\", \"搞\", \"⑥\", \"裤\", \"拎\", \"霈\", \"频\", \"飚\", \"辜\", \"屠\", \"痘\", \"榴\", \"唷\", \"惜\", \"蕾\", \"鳗\", \"杂\", \"嘘\", \"逮\", \"鉴\", \"红\", \"逅\", \"螂\", \"怜\", \"呷\", \"桅\", \"惚\", \"娅\", \"粒\", \"裹\", \"熬\", \"皮\", \"⒋\", \"掌\", \"飓\", \"饮\", \"凑\", \"碴\", \"冥\", \"嗓\", \"內\", \"芦\", \"故\", \"辕\", \"视\", \"薩\", \"爬\", \"下\", \"马\", \"裂\", \"瀛\", \"皑\", \"神\", \"崩\", \"醋\", \"哥\", \"挥\", \"萃\", \"嘀\", \"鲁\", \"ヨ\", \"尤\", \"罗\", \"咸\", \"谭\", \"蛙\", \"谎\", \"烛\", \"串\", \"雍\", \"其\"]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ar": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2813283,
"_n_tokens": 615514,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/de": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1814876,
"_n_tokens": 499766,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/en": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1124813,
"_n_tokens": 254944,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/es": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1664455,
"_n_tokens": 433289,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/fa": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2054052,
"_n_tokens": 387448,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/fr": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1540504,
"_n_tokens": 412146,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ja": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1774770,
"_n_tokens": 414715,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/ko": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 1524839,
"_n_tokens": 412595,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"gradientai/Llama-3-8B-Instruct-Gradient-1048k @ cc100/zh-Hans": {
"tokenizer": "llama3",
"organization": "Meta",
"vocab_size": 128256,
"_n_bytes": 2633047,
"_n_tokens": 747405,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"hfl/chinese-alpaca-lora-7b @ cc100/ar": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2813283,
"_n_tokens": 1411469,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/de": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1814876,
"_n_tokens": 513706,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/en": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1124813,
"_n_tokens": 281471,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/es": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1664455,
"_n_tokens": 476720,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/fa": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2054052,
"_n_tokens": 1140740,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/fr": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1540504,
"_n_tokens": 440299,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/ja": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1774770,
"_n_tokens": 604112,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/ko": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 1524839,
"_n_tokens": 903453,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-alpaca-lora-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-alpaca-lora-7b",
"organization": "-",
"vocab_size": 49954,
"_n_bytes": 2633047,
"_n_tokens": 613993,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/ar": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/de": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1814876,
"_n_tokens": 527318,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/en": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/es": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/fa": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2054052,
"_n_tokens": 1145078,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/fr": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/ja": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1774770,
"_n_tokens": 614367,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/ko": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 1524839,
"_n_tokens": 953427,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-2-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-llama-2-7b",
"organization": "-",
"vocab_size": 55296,
"_n_bytes": 2633047,
"_n_tokens": 616545,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/ar": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2813283,
"_n_tokens": 1411469,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/de": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1814876,
"_n_tokens": 513706,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/en": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1124813,
"_n_tokens": 281471,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/es": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1664455,
"_n_tokens": 476720,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/fa": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2054052,
"_n_tokens": 1140740,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/fr": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1540504,
"_n_tokens": 440299,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/ja": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1774770,
"_n_tokens": 604112,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/ko": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 1524839,
"_n_tokens": 903453,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/chinese-llama-lora-7b @ cc100/zh-Hans": {
"tokenizer": "chinese-llama-lora-7b",
"organization": "-",
"vocab_size": 49953,
"_n_bytes": 2633047,
"_n_tokens": 613993,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hfl/llama-3-chinese-8b @ cc100/ar": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2813283,
"_n_tokens": 614186,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/de": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1814876,
"_n_tokens": 499766,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/en": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1124813,
"_n_tokens": 254944,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/es": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1664455,
"_n_tokens": 433286,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/fa": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2054052,
"_n_tokens": 384591,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/fr": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1540504,
"_n_tokens": 412141,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/ja": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1774770,
"_n_tokens": 414715,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/ko": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 1524839,
"_n_tokens": 412433,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"hfl/llama-3-chinese-8b @ cc100/zh-Hans": {
"tokenizer": "llama-3-chinese-8b",
"organization": "-",
"vocab_size": 128256,
"_n_bytes": 2633047,
"_n_tokens": 747405,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"hpcai-tech/grok-1 @ cc100/ar": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2813283,
"_n_tokens": 1392088,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/de": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1814876,
"_n_tokens": 505220,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/en": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1124813,
"_n_tokens": 258048,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/es": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1664455,
"_n_tokens": 449392,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/fa": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2054052,
"_n_tokens": 1073281,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/fr": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1540504,
"_n_tokens": 428298,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/ja": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1774770,
"_n_tokens": 497590,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/ko": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 1524839,
"_n_tokens": 1152005,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"hpcai-tech/grok-1 @ cc100/zh-Hans": {
"tokenizer": "grok-1",
"organization": "xAI",
"vocab_size": 131072,
"_n_bytes": 2633047,
"_n_tokens": 1414508,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/ar": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/de": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/en": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/es": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/fa": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/fr": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/ja": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/ko": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"huggyllama/llama-7b @ cc100/zh-Hans": {
"tokenizer": "llama",
"organization": "Meta",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm-chat-7b @ cc100/ar": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2813283,
"_n_tokens": 522046,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/de": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1814876,
"_n_tokens": 570489,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/en": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1124813,
"_n_tokens": 261293,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/es": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1664455,
"_n_tokens": 506572,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/fa": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2054052,
"_n_tokens": 630945,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/fr": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1540504,
"_n_tokens": 485045,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/ja": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1774770,
"_n_tokens": 438212,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/ko": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1524839,
"_n_tokens": 829609,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-chat-7b @ cc100/zh-Hans": {
"tokenizer": "internlm-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2633047,
"_n_tokens": 569109,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/ar": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2813283,
"_n_tokens": 522046,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/de": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1814876,
"_n_tokens": 570489,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/en": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1124813,
"_n_tokens": 261293,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/es": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1664455,
"_n_tokens": 506572,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/fa": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2054052,
"_n_tokens": 630945,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/fr": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1540504,
"_n_tokens": 485045,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/ja": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1774770,
"_n_tokens": 438212,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/ko": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 1524839,
"_n_tokens": 829609,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"internlm/internlm-xcomposer-7b @ cc100/zh-Hans": {
"tokenizer": "internlm-xcomposer-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 103168,
"_n_bytes": 2633047,
"_n_tokens": 569109,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"internlm/internlm2-chat-7b @ cc100/ar": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2813283,
"_n_tokens": 1625378,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/de": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1814876,
"_n_tokens": 573917,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/en": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1124813,
"_n_tokens": 261583,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/es": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1664455,
"_n_tokens": 508871,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/fa": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2054052,
"_n_tokens": 1185032,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/fr": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1540504,
"_n_tokens": 486629,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/ja": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1774770,
"_n_tokens": 585803,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/ko": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1524839,
"_n_tokens": 998524,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-chat-7b @ cc100/zh-Hans": {
"tokenizer": "internlm2-chat-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2633047,
"_n_tokens": 569976,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/ar": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2813283,
"_n_tokens": 1625378,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/de": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1814876,
"_n_tokens": 573917,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/en": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1124813,
"_n_tokens": 261583,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/es": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1664455,
"_n_tokens": 508871,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/fa": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2054052,
"_n_tokens": 1185032,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/fr": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1540504,
"_n_tokens": 486629,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/ja": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1774770,
"_n_tokens": 585803,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/ko": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 1524839,
"_n_tokens": 998524,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"internlm/internlm2-math-7b @ cc100/zh-Hans": {
"tokenizer": "internlm2-math-7b",
"organization": "Shanghai AI Lab",
"vocab_size": 92544,
"_n_bytes": 2633047,
"_n_tokens": 569976,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ar": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2813283,
"_n_tokens": 822267,
"_n_chars": 1560987,
"_n_oov_chars": 1248838,
"oov_ratio": 0.8000310060237529,
"_oov_charset": "[\"½\", \"\", \"ً\", \"ۗ\", \"█\", \"ظ\", \"ح\", \"ۤ\", \"ل\", \"μ\", \"↩\", \"ک\", \"ی\", \"ج\", \"ة\", \"ب\", \"ع\", \"ذ\", \"″\", \"٠\", \"﴾\", \"د\", \"ض\", \"۸\", \"\", \"ُ\", \"▫\", \"ز\", \"٤\", \"٥\", \"ق\", \"٪\", \"…\", \"و\", \"ي\", \"χ\", \"ﻹ\", \"ٱ\", \"أ\", \"آ\", \"خ\", \"😊\", \"α\", \"ή\", \"😀\", \"�\", \"۰\", \"\", \"٣\", \"~\", \"َ\", \"⤴\", \"٩\", \"ٹ\", \"ۖ\", \"س\", \"ۚ\", \"ْ\", \"ί\", \"ن\", \"🙂\", \"\", \"Х\", \"،\", \"ك\", \"¡\", \"ﷺ\", \"ھ\", \"ء\", \"٦\", \"ر\", \"×\", \"ؤ\", \"پ\", \"٢\", \"ا\", \"▪\", \"ِ\", \"‹\", \"←\", \"ﻻ\", \"\", \"٧\", \"♥\", \"م\", \"ف\", \"ّ\", \"τ\", \"چ\", \"ه\", \"ث\", \"؟\", \"غ\", \"ﻷ\", \"؛\", \"۷\", \"ρ\", \"﴿\", \"إ\", \"©\", \"ت\", \"ـ\", \"η\", \"›\", \"
\", \"ش\", \"ٌ\", \"ٍ\", \"ى\", \"٨\", \"ص\", \"\", \"ٰ\", \"١\", \"ئ\", \"κ\", \"۲\", \"ط\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/de": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1814876,
"_n_tokens": 726989,
"_n_chars": 1784021,
"_n_oov_chars": 1931,
"oov_ratio": 0.0010823863620439446,
"_oov_charset": "[\"²\", \"½\", \"\", \"ú\", \"★\", \"↩\", \"œ\", \"😈\", \"Ä\", \"¬\", \"🙁\", \"ι\", \"☺\", \"Ã\", \" \", \"…\", \"ε\", \"u\", \"Á\", \"α\", \"ï\", \"😀\", \"�\", \"♡\", \"§\", \"İ\", \"Ö\", \"~\", \"ė\", \"¿\", \"å\", \"ć\", \"≠\", \"č\", \"ø\", \"♦\", \"ί\", \"\", \"🙂\", \"̈\", \"ā\", \"😃\", \"\", \"¹\", \"↑\", \"😦\", \"😉\", \"´\", \"‹\", \"\", \"♥\", \"‽\", \"¶\", \"‐\", \"❤\", \"τ\", \"ớ\", \"🙄\", \"Ø\", \"😢\", \"\", \"→\", \"ς\", \"ρ\", \"¤\", \"©\", \"¼\", \"š\", \"›\", \"\", \"−\", \"·\", \"™\", \"Ÿ\", \"ń\", \"😆\", \"➔\", \"‚\", \"😂\", \"▼\", \"ư\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/es": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1664455,
"_n_tokens": 960105,
"_n_chars": 1630297,
"_n_oov_chars": 11584,
"oov_ratio": 0.007105453791548411,
"_oov_charset": "[\"²\", \"ª\", \"✪\", \"Ó\", \"Í\", \"🙂\", \"✖\", \"ú\", \"\", \"→\", \"í\", \"\", \"Á\", \"Ñ\", \"ñ\", \"¡\", \"º\", \"©\", \"😀\", \"Ú\", \"\", \"■\", \"×\", \"🙁\", \"·\", \"😦\", \"″\", \"ý\", \"😉\", \"´\", \"←\", \"―\", \"¿\", \"ò\", \"✓\", \"✔\", \"▷\", \"❤\", \"ø\", \"👍\", \"М\", \"️\", \"\", \"👏\", \"…\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/fa": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 2054052,
"_n_tokens": 702443,
"_n_chars": 1145876,
"_n_oov_chars": 898585,
"oov_ratio": 0.7841904359634027,
"_oov_charset": "[\"✿\", \"\", \"ً\", \"◄\", \"ظ\", \"ح\", \"★\", \"ل\", \"ﮧ\", \"ک\", \"ּ\", \"ی\", \"ج\", \"ة\", \"ب\", \"ع\", \"ذ\", \"٠\", \"د\", \"ض\", \"۸\", \"۱\", \"ُ\", \"ز\", \"٤\", \"٥\", \"ٴ\", \"ق\", \"گ\", \"٪\", \"…\", \"ي\", \"و\", \"أ\", \"آ\", \"خ\", \"ژ\", \"�\", \"۰\", \"\", \"۵\", \"٣\", \"َ\", \"ٔ\", \"٩\", \"س\", \"ْ\", \"️\", \"ن\", \"ڪ\", \"\", \"●\", \"\", \"،\", \"٫\", \"ك\", \"۶\", \"ט\", \"ھ\", \"ء\", \"ر\", \"پ\", \"×\", \"ؤ\", \"ۀ\", \"٢\", \"ا\", \"ِ\", \"\", \"٧\", \"♥\", \"م\", \"ف\", \"ّ\", \"❤\", \"ه\", \"چ\", \"ث\", \"؟\", \"غ\", \"ے\", \"؛\", \"۔\", \"۷\", \"۹\", \"۳\", \"إ\", \"©\", \"ت\", \"ـ\", \"ב\", \"›\", \"▐\", \"ش\", \"ۆ\", \"ٌ\", \"·\", \"ٍ\", \"ى\", \"٨\", \"ص\", \"\", \"١\", \"ئ\", \"۲\", \"۴\", \"ط\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/fr": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1540504,
"_n_tokens": 707675,
"_n_chars": 1484970,
"_n_oov_chars": 1363,
"oov_ratio": 0.0009178636605453309,
"_oov_charset": "[\"²\", \"🙂\", \"ë\", \"🤔\", \"ã\", \"★\", \"í\", \"℃\", \"♕\", \"
\", \"♠\", \"Ê\", \"À\", \"Ô\", \"µ\", \"œ\", \"̧\", \"ï\", \"ğ\", \"😀\", \"�\", \"§\", \"\", \"·\", \"™\", \"~\", \"″\", \"😉\", \"´\", \"È\", \"←\", \"―\", \"́\", \"̂\", \"‐\", \"Ç\", \"❤\", \"…\", \"Â\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ja": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1774770,
"_n_tokens": 43915,
"_n_chars": 603065,
"_n_oov_chars": 585664,
"oov_ratio": 0.9711457305597241,
"_oov_charset": "[\"T\", \"申\", \"釘\", \"曇\", \"婿\", \"博\", \"力\", \"委\", \"¥\", \"Q\", \"疎\", \"叉\", \"滓\", \"獄\", \"1\", \"液\", \"福\", \"楊\", \"祇\", \"穂\", \"全\", \"似\", \"験\", \"墳\", \"V\", \"ゴ\", \"牲\", \"装\", \"核\", \"k\", \"ぬ\", \"賛\", \"迎\", \"記\", \"猟\", \"庫\", \"冷\", \"娯\", \"栄\", \"リ\", \"□\", \"法\", \"呆\", \"麗\", \"袖\", \"憂\", \"整\", \"髪\", \"炒\", \"艦\", \"ギ\", \"舐\", \"藻\", \"抑\", \"爆\", \"倭\", \"懸\", \"泡\", \"的\", \"秒\", \"至\", \"嫉\", \"聾\", \"桟\", \"逮\", \"封\", \"排\", \"寺\", \"圏\", \"情\", \"嗅\", \"泌\", \"匙\", \"む\", \"涯\", \"幽\", \"迷\", \"殊\", \"慰\", \"坐\", \"罰\", \"微\", \"差\", \"傲\", \"棄\", \"ぎ\", \"ネ\", \"耶\", \"😌\", \"ジ\", \"曲\", \"燃\", \"快\", \"託\", \"ユ\", \"撫\", \"坂\", \"惧\", \"喪\", \"嚥\", \"寸\", \"衆\", \"塗\", \"澤\", \"欺\", \"会\", \"❤\", \"猛\", \"看\", \"局\", \"僭\", \"矛\", \"徊\", \"逢\", \"豚\", \"羞\", \"帯\", \"生\", \"把\", \"肉\", \"嬢\", \"出\", \"尋\", \"躊\", \"う\", \"先\", \"劇\", \"与\", \"遣\", \"拍\", \"面\", \"ゼ\", \"埋\", \"[\", \"托\", \"詩\", \"巧\", \"延\", \"杯\", \"恥\", \"捨\", \"摘\", \"能\", \"寿\", \"抜\", \"よ\", \"侍\", \"盲\", \"給\", \"焼\", \"捏\", \"或\", \"借\", \"堅\", \"垢\", \"溜\", \"洋\", \"柱\", \"伺\", \"\", \"洪\", \"賀\", \"章\", \"辣\", \"手\", \"隕\", \"泣\", \"者\", \"営\", \"典\", \"胚\", \"県\", \"倉\", \"豪\", \"懲\", \"注\", \"因\", \"擢\", \"剥\", \"甘\", \"選\", \"喝\", \"m\", \"顧\", \"痺\", \"齢\", \"孤\", \"等\", \"享\", \"淳\", \"硝\", \"大\", \"従\", \"歴\", \"و\", \"眩\", \"ε\", \"丘\", \"束\", \"男\", \"摯\", \"璧\", \"罵\", \"良\", \"釣\", \"絡\", \"絞\", \"寝\", \"ゝ\", \"河\", \"敬\", \"庁\", \"⌒\", \"隅\", \"乙\", \"女\", \"彌\", \"顎\", \"史\", \"範\", \"羅\", \"紹\", \"天\", \"焦\", \"誉\", \"対\", \"答\", \"罪\", \"寓\", \"敗\", \"風\", \"捧\", \"腱\", \"俄\", \"銭\", \"更\", \"消\", \"揃\", \"妹\", \"憑\", \"霧\", \"o\", \"祥\", \"匂\", \"峨\", \"弟\", \"品\", \"※\", \"峠\", \"猫\", \"徹\", \"窒\", \"揮\", \"隙\", \"夷\", \"専\", \"唯\", \"間\", \"欧\", \"F\", \"楓\", \"謎\", \"W\", \"ば\", \"再\", \"帆\", \"相\", \"短\", \"雄\", \"梁\", \"闘\", \"檀\", \"保\", \"要\", \"秋\", \"州\", \"脚\", \"覚\", \"房\", \"鱈\", \"隊\", \"ふ\", \"地\", \"下\", \"貰\", \"慣\", \"堡\", \"四\", \"富\", \"礁\", \"飾\", \"世\", \"毎\", \"湘\", \"余\", \"ガ\", \"糧\", \"座\", \"ブ\", \"雲\", \"魅\", \"椿\", \"i\", \"淹\", \"認\", \"幸\", \"−\", \"英\", \"我\", \"戸\", \"5\", \"雇\", \"墾\", \"媒\", \"讐\", \"妊\", \"頷\", \"殖\", \"纏\", \"睦\", \"餌\", \"脆\", \"吠\", \"除\", \"是\", \"採\", \"厳\", \"度\", \"尻\", \"宿\", \"d\", \"葉\", \"唆\", \"境\", \"カ\", \"ず\", \"霞\", \"凌\", \"邦\", \"陵\", \"丹\", \"七\", \"杓\", \"物\", \"ゥ\", \"幼\", \"媛\", \"急\", \"痕\", \"麦\", \"憤\", \"貸\", \".\", \"鍛\", \"丼\", \"去\", \"¥\", \"煩\", \"ア\", \"古\", \"街\", \"喉\", \"之\", \"巾\", \"熊\", \"該\", \"随\", \"話\", \"祠\", \"臨\", \"交\", \"莽\", \"S\", \"於\", \"干\", \"オ\", \"く\", \"痛\", \"起\", \"旺\", \"植\", \"募\", \"数\", \"ペ\", \"潟\", \"破\", \"膚\", \"淫\", \"惑\", \"暢\", \"げ\", \"畜\", \"媚\", \"恨\", \"綬\", \"魏\", \"幻\", \"奢\", \"高\", \"渡\", \"石\", \"彷\", \"区\", \"版\", \"獲\", \"小\", \"渦\", \"譚\", \"コ\", \"互\", \"績\", \"薩\", \"痩\", \"午\", \"潮\", \"勢\", \"翼\", \"値\", \"桃\", \"利\", \"あ\", \"島\", \"ズ\", \"ァ\", \"梨\", \"粉\", \"貫\", \"_\", \"塵\", \"咽\", \"身\", \"俵\", \"少\", \"音\", \"鬱\", \"森\", \"汲\", \"聖\", \"脈\", \"蓋\", \"嘆\", \"G\", \"渓\", \"泊\", \"姑\", \"喇\", \"後\", \"纒\", \"費\", \"違\", \"鞄\", \"俯\", \"網\", \"興\", \"回\", \"倍\", \"震\", \"灰\", \"飼\", \"▽\", \"印\", \"麓\", \"打\", \"D\", \"←\", \"る\", \"西\", \"威\", \"芳\", \"楚\", \"M\", \"現\", \"舟\", \"舎\", \"何\", \"文\", \"椅\", \"泉\", \"早\", \"絵\", \"浜\", \"積\", \"繰\", \"応\", \"氷\", \"通\", \"遺\", \"す\", \"偽\", \"押\", \"傷\", \"習\", \"飯\", \"勇\", \"合\", \"3\", \"母\", \"灼\", \"裁\", \"́\", \"層\", \"填\", \"云\", \"R\", \"撃\", \"岬\", \"偏\", \"釜\", \"眼\", \"濡\", \"水\", \"妖\", \"中\", \"刊\", \"耳\", \"留\", \"杖\", \"厄\", \"半\", \"危\", \"慮\", \"平\", \"述\", \"明\", \"儲\", \"曽\", \"農\", \"怠\", \"技\", \"腑\", \"献\", \"月\", \"滋\", \"N\", \"斗\", \"視\", \"蹴\", \"噤\", \"疑\", \"彫\", \"腔\", \"💦\", \"八\", \"Z\", \"匠\", \"扉\", \"席\", \"虫\", \"毒\", \"搬\", \"解\", \"沿\", \"倫\", \"正\", \"些\", \"✨\", \"傑\", \"๑\", \"浄\", \"韓\", \"雷\", \"酸\", \"証\", \"肌\", \"場\", \"妻\", \"牙\", \"谷\", \"病\", \"砕\", \"線\", \"亡\", \"玄\", \"桂\", \"特\", \"み\", \"悔\", \"存\", \"○\", \"包\", \"び\", \"穴\", \"腫\", \"ね\", \"移\", \"類\", \"姥\", \"寮\", \"説\", \"ク\", \"雰\", \"推\", \"輸\", \"薬\", \"陽\", \"結\", \"副\", \"掴\", \"界\", \"但\", \"挑\", \"‥\", \"琴\", \"戯\", \"詰\", \"じ\", \"僅\", \"造\", \"係\", \"症\", \"垠\", \"功\", \"奥\", \"科\", \"-\", \"綜\", \"戻\", \"竹\", \"舞\", \"誇\", \"覗\", \"検\", \"居\", \"即\", \"れ\", \"縫\", \"個\", \"宋\", \"継\", \"理\", \"行\", \"励\", \"甥\", \"ゞ\", \"苑\", \"景\", \"嘩\", \"嫌\", \"コ\", \"巻\", \"e\", \"膿\", \"受\", \"著\", \"⇔\", \"光\", \"浸\", \"宣\", \"ま\", \"C\", \"t\", \"疾\", \"蔓\", \"遥\", \"」\", \"点\", \"儀\", \"布\", \"播\", \"【\", \"闊\", \"背\", \"©\", \"字\", \"敵\", \"超\", \"停\", \"菓\", \"脳\", \"拠\", \"潰\", \"本\", \"礎\", \"稿\", \"寇\", \"召\", \"取\", \"躾\", \"稚\", \"熟\", \"眉\", \"閣\", \"歯\", \"凶\", \"遵\", \"髭\", \"K\", \"ゆ\", \"け\", \"乏\", \"喩\", \"f\", \"例\", \"嵌\", \"キ\", \"如\", \"笠\", \"襲\", \"守\", \"録\", \"橋\", \"譲\", \"枢\", \"悩\", \"轢\", \"套\", \"軟\", \"珪\", \"護\", \"宜\", \"蝶\", \"帽\", \"逐\", \"向\", \"渇\", \"億\", \"斡\", \"彦\", \"拳\", \"貪\", \"詫\", \"成\", \"融\", \"関\", \"郭\", \"血\", \"電\", \"鉱\", \"芝\", \"柄\", \"創\", \"Д\", \"攻\", \"悠\", \"潤\", \"監\", \"補\", \"刺\", \"府\", \"劣\", \"◇\", \"駆\", \"惣\", \"輪\", \"隼\", \"影\", \"退\", \"肪\", \"鋲\", \"露\", \"圧\", \"虹\", \"拙\", \"換\", \"附\", \"稲\", \"祝\", \"宏\", \"ω\", \"蓄\", \"窮\", \"捲\", \"肩\", \"糖\", \"意\", \"込\", \"辞\", \"勉\", \"締\", \"笑\", \"鉄\", \"題\", \"勘\", \"否\", \"裏\", \"▷\", \"育\", \"ト\", \"箇\", \"趨\", \"雑\", \"目\", \"甚\", \"却\", \"盗\", \"語\", \"婚\", \"側\", \"尾\", \"照\", \"縞\", \"凍\", \"漢\", \"挨\", \"武\", \"具\", \"寄\", \"菜\", \"崩\", \"贔\", \"訊\", \"班\", \"乾\", \"「\", \"鈍\", \"海\", \"〔\", \"藁\", \"途\", \"淵\", \"掌\", \"喚\", \"こ\", \"羽\", \"へ\", \"た\", \"太\", \"兆\", \"浪\", \"⑧\", \"散\", \"陶\", \"温\", \"茂\", \"遼\", \"℃\", \"愉\", \"寂\", \"終\", \"粒\", \"詐\", \"遠\", \"ド\", \"複\", \"峙\", \"宮\", \"戚\", \"了\", \"憧\", \"翌\", \"唄\", \"リ\", \"り\", \"刻\", \"暴\", \"序\", \"箱\", \"据\", \"華\", \"曜\", \"腐\", \"繁\", \"含\", \"n\", \"裾\", \"腎\", \"誤\", \"賭\", \"垂\", \"に\", \"鼓\", \"救\", \"I\", \"炎\", \"虐\", \"乗\", \"町\", \"刀\", \"航\", \"阿\", \"ノ\", \"盛\", \"嫁\", \"テ\", \"゙\", \"─\", \"仔\", \"兼\", \"偶\", \"か\", \"駕\", \"牛\", \"邸\", \"車\", \"軸\", \"珍\", \"滴\", \"拷\", \"壊\", \"堰\", \"メ\", \"戒\", \"嗜\", \"伏\", \"配\", \"拓\", \"縮\", \"掃\", \"冥\", \"体\", \"限\", \"直\", \"空\", \"周\", \"逸\", \"協\", \"廻\", \"漂\", \"親\", \"錬\", \"床\", \"遅\", \"ナ\", \"占\", \"膨\", \"穢\", \"も\", \"衿\", \"濃\", \"多\", \"諾\", \"票\", \"診\", \"凄\", \"鎌\", \"才\", \"躇\", \"揶\", \"だ\", \"冬\", \"允\", \"晩\", \"盤\", \"派\", \"完\", \"氏\", \"丈\", \"堤\", \"荻\", \"め\", \"培\", \"想\", \"池\", \"各\", \"種\", \"ォ\", \"墟\", \"供\", \"催\", \"窓\", \"拘\", \"付\", \"製\", \"院\", \"飢\", \"a\", \"煎\", \"擬\", \"聞\", \"堀\", \"練\", \"捜\", \"炭\", \"逼\", \"ざ\", \"崎\", \"ゥ\", \"︎\", \"Ⅹ\", \"痒\", \"奉\", \"撤\", \"壇\", \"型\", \"阪\", \"咳\", \"姜\", \"惜\", \"瀬\", \"柔\", \"索\", \"縦\", \"欝\", \"同\", \"』\", \"朗\", \"商\", \"昼\", \"遇\", \"週\", \"噛\", \"◎\", \"彩\", \"有\", \"臆\", \"候\", \"丿\", \"欣\", \"韮\", \"旧\", \"領\", \"覧\", \"続\", \"\\b\", \"斑\", \"架\", \"兎\", \"滅\", \"溢\", \"堂\", \"沖\", \"剣\", \"逃\", \"組\", \"穏\", \"極\", \"馳\", \"服\", \"楼\", \"グ\", \"聴\", \"球\", \"缶\", \"懇\", \"由\", \"普\", \"跨\", \"伐\", \"裸\", \"知\", \"癒\", \"昭\", \"吸\", \"困\", \"運\", \"憲\", \"扱\", \"せ\", \"ろ\", \"慈\", \"深\", \"ラ\", \"織\", \"信\", \"達\", \"故\", \"ぅ\", \"括\", \"棚\", \"狐\", \"標\", \"準\", \"憩\", \"謂\", \"城\", \"曹\", \"油\", \"制\", \"右\", \"》\", \"策\", \"怪\", \"旗\", \"貢\", \"撒\", \"需\", \"…\", \"盆\", \"連\", \"郡\", \"障\", \"⇒\", \"施\", \"鵜\", \"備\", \"カ\", \"路\", \"眺\", \"暑\", \"充\", \"截\", \"士\", \"嶋\", \"揉\", \"入\", \"波\", \"言\", \"越\", \"机\", \"〈\", \"心\", \"ヵ\", \"―\", \"枝\", \"侮\", \"ピ\", \"遊\", \"厨\", \"紋\", \"授\", \"友\", \"挫\", \"沼\", \"横\", \"夜\", \"①\", \"昧\", \"ャ\", \"執\", \"浩\", \"棒\", \"徘\", \" ̄\", \"煽\", \"し\", \"゙\", \"↓\", \"問\", \"『\", \"負\", \"〟\", \"克\", \"黄\", \"穀\", \"漑\", \"駐\", \"止\", \"密\", \"ィ\", \"掛\", \"銘\", \"朝\", \"灘\", \"‼\", \"詈\", \"箋\", \"様\", \"騰\", \"頑\", \"ア\", \"隆\", \"康\", \"尼\", \"射\", \"教\", \"叶\", \"X\", \"\", \"倒\", \"陳\", \"況\", \"田\", \"ヌ\", \"姓\", \"青\", \"健\", \"弊\", \"依\", \"暦\", \"来\", \"総\", \"ぞ\", \"仙\", \"ツ\", \"頭\", \"鐘\", \"昏\", \"六\", \"香\", \"潜\", \"枯\", \"讃\", \"糾\", \"符\", \"謄\", \"板\", \"て\", \"抵\", \"曖\", \"獣\", \"剤\", \"ぁ\", \"丁\", \"江\", \"巡\", \"議\", \"鈴\", \"恋\", \"b\", \"⑩\", \"嘗\", \"褒\", \"遙\", \"不\", \"イ\", \"鼻\", \"染\", \"葬\", \"仰\", \"尚\", \"H\", \"鋭\", \"竜\", \"擁\", \"室\", \"◯\", \"ー\", \"政\", \"管\", \"清\", \"雨\", \"桁\", \"殆\", \"昆\", \"討\", \"ベ\", \"量\", \"き\", \"呼\", \"綻\", \"川\", \"態\", \"べ\", \"順\", \"の\", \"息\", \"紅\", \"鉢\", \"外\", \"松\", \"忍\", \"羨\", \"逆\", \"揄\", \"啜\", \"パ\", \"徨\", \"緻\", \",\", \"狙\", \"条\", \"迅\", \"蘇\", \"緒\", \"歓\", \"焙\", \"軌\", \"弓\", \"隔\", \"豆\", \"ダ\", \"嵯\", \"萎\", \"勧\", \"嘲\", \"愕\", \"争\", \"騙\", \"怨\", \"亭\", \"壬\", \"梗\", \"�\", \"掬\", \"悍\", \"2\", \"胸\", \"膏\", \"材\", \"忠\", \"~\", \"訓\", \"減\", \"時\", \"苦\", \"追\", \"匡\", \"誕\", \"拡\", \"論\", \"々\", \"疲\", \"秘\", \"腺\", \"絶\", \"唐\", \"木\", \"共\", \"僕\", \"暖\", \"漫\", \"恒\", \"宛\", \"輝\", \"宇\", \"揺\", \"霊\", \"誓\", \"端\", \"第\", \"ご\", \"改\", \"被\", \"攘\", \"駒\", \"殴\", \"ぴ\", \"⻑\", \"犯\", \"嵩\", \"輩\", \"価\", \"撲\", \"津\", \"貿\", \"喰\", \"淡\", \"蔵\", \"梯\", \"ほ\", \"と\", \"ム\", \"東\", \"わ\", \"ロ\", \"省\", \"衛\", \"懐\", \"囚\", \"ぃ\", \"犠\", \"幅\", \"捕\", \"✧\", \"激\", \"蒔\", \"寒\", \"壮\", \"晶\", \"孝\", \"贈\", \"厭\", \"酔\", \"ヘ\", \"」\", \"屓\", \"栓\", \"摩\", \"歳\", \"約\", \"〇\", \"酬\", \"携\", \"事\", \"俺\", \"頒\", \"菊\", \"愚\", \"動\", \"握\", \"錯\", \"\", \"速\", \"塞\", \"警\", \"句\", \"為\", \"滞\", \"過\", \"巨\", \"楽\", \"駄\", \"屈\", \"堵\", \"蛇\", \"俗\", \"比\", \"祭\", \"飲\", \"瓢\", \"党\", \"幡\", \"◆\", \"ソ\", \"陣\", \"館\", \"衝\", \"琶\", \"吐\", \"脇\", \"欽\", \"好\", \"゚\", \"変\", \"銀\", \"彰\", \"茨\", \"往\", \"尽\", \"テ\", \"欠\", \"納\", \"冒\", \"域\", \"瞑\", \"モ\", \"蛍\", \"蒙\", \"秤\", \"狭\", \"灯\", \"夏\", \"枠\", \"弱\", \"閉\", \"慶\", \"着\", \"辛\", \"は\", \"損\", \"金\", \"9\", \"ロ\", \"尿\", \"誌\", \"凡\", \"忽\", \"狼\", \"刑\", \"糞\", \"触\", \"佇\", \"ハ\", \"腸\", \"在\", \"環\", \"ヲ\", \"然\", \"窃\", \"ぜ\", \"近\", \"李\", \"閑\", \"祀\", \"令\", \"遍\", \"賠\", \"角\", \"弄\", \"校\", \"諏\", \"渕\", \"狂\", \"持\", \"休\", \"械\", \"円\", \"佳\", \"逡\", \"率\", \"呟\", \"報\", \"秩\", \"傍\", \"犬\", \"ぱ\", \"家\", \"②\", \"奮\", \"杏\", \"B\", \"異\", \"漱\", \"凝\", \"感\", \"形\", \"胎\", \"顔\", \"燥\", \"臣\", \"磨\", \"ヽ\", \"綾\", \"暇\", \"踪\", \"串\", \"使\", \"愛\", \"売\", \"趣\", \"律\", \"刷\", \"払\", \"裟\", \"添\", \"敏\", \"乞\", \"紐\", \"亮\", \"悶\", \"増\", \"償\", \"勲\", \"独\", \"賑\", \"尊\", \"芸\", \"綺\", \"紀\", \"祐\", \"〆\", \"澪\", \"針\", \"磋\", \"弾\", \"童\", \"食\", \"免\", \"昨\", \"担\", \"系\", \"厚\", \"構\", \"寛\", \"夕\", \"粋\", \"住\", \"咲\", \"強\", \"熱\", \"徳\", \"が\", \"十\", \"船\", \"柏\", \"醍\", \"惨\", \"ホ\", \"幣\", \"奏\", \"】\", \"勝\", \"叫\", \"復\", \"謀\", \"概\", \"鎮\", \"振\", \"赴\", \"諺\", \"煙\", \"榴\", \"貼\", \"汗\", \"謡\", \"宗\", \"そ\", \"門\", \"己\", \"児\", \"叭\", \"閃\", \"慎\", \"ぉ\", \"蜂\", \"蔽\", \"害\", \"捗\", \"優\", \"兄\", \"訴\", \"猶\", \"均\", \"/\", \"指\", \"仕\", \"ぼ\", \"幹\", \"鍋\", \"集\", \"梅\", \"考\", \"真\", \"奨\", \"濯\", \"槃\", \"仁\", \"舗\", \"づ\", \"質\", \"ぇ\", \"混\", \"学\", \"次\", \"烹\", \"定\", \"資\", \"客\", \"削\", \"ッ\", \"瓦\", \"彙\", \"虜\", \"表\", \"ワ\", \"俳\", \"貌\", \"浦\", \"堪\", \"購\", \"所\", \"=\", \"火\", \"樺\", \"苛\", \"伯\", \"賃\", \"暁\", \"冨\", \"😭\", \"断\", \"味\", \"固\", \"乱\", \"裂\", \"燭\", \"審\", \"ゲ\", \"鶴\", \"猿\", \"伸\", \"左\", \"仏\", \"摂\", \"ゃ\", \"離\", \"漠\", \"嫡\", \"轄\", \"雅\", \"梳\", \"奴\", \"紛\", \"団\", \"届\", \"碍\", \"伽\", \"殲\", \"帰\", \"拒\", \"貨\", \"和\", \"反\", \"距\", \"部\", \"紡\", \"屹\", \"化\", \"´\", \"惚\", \"経\", \"妃\", \"仮\", \"私\", \"ニ\", \"憎\", \"ぐ\", \"箭\", \"送\", \"財\", \"瞭\", \"陰\", \"許\", \"→\", \"﨑\", \"重\", \"替\", \"夢\", \"奪\", \"浴\", \"隈\", \"描\", \"精\", \"J\", \"預\", \"神\", \"販\", \"北\", \"④\", \"未\", \"^\", \"季\", \"名\", \"繋\", \"企\", \"◡\", \"抱\", \"粘\", \"荒\", \"圃\", \"庭\", \"稀\", \"遽\", \"え\", \"当\", \"号\", \"丸\", \"駿\", \"▼\", \"杞\", \"加\", \"勿\", \"姿\", \"防\", \"機\", \"レ\", \"援\", \"札\", \"ゎ\", \"債\", \"。\", \"哲\", \"永\", \"塊\", \"台\", \"労\", \"杼\", \"慌\", \"患\", \"槍\", \"傘\", \"敷\", \"期\", \"鬼\", \"悲\", \"殺\", \"凱\", \"腕\", \"△\", \"細\", \"牧\", \"容\", \"槌\", \"偉\", \"将\", \"善\", \"舌\", \"念\", \"喧\", \"旬\", \"日\", \"模\", \"臭\", \"声\", \"阜\", \"肝\", \"待\", \"③\", \"列\", \"袈\", \"叱\", \"書\", \"涼\", \"い\", \"気\", \"状\", \"耗\", \"冗\", \"鉛\", \"遭\", \"郷\", \"腰\", \"園\", \"♡\", \"醐\", \"幌\", \"晋\", \"支\", \"歌\", \"属\", \"旨\", \"靄\", \"恭\", \"さ\", \"拉\", \"粗\", \"易\", \"彿\", \"承\", \"溶\", \"見\", \"麻\", \"貯\", \"欄\", \"辰\", \"径\", \"君\", \"誹\", \"捉\", \"∇\", \"自\", \"井\", \"職\", \"進\", \"編\", \"馴\", \"切\", \"訣\", \"衡\", \"観\", \"詞\", \"ン\", \"盾\", \"疇\", \"較\", \"煮\", \"恐\", \"諸\", \"源\", \"済\", \"陥\", \"噌\", \"〉\", \"草\", \"壁\", \"P\", \"旦\", \"唾\", \"徐\", \"踏\", \"↑\", \"足\", \"叩\", \"百\", \"杉\", \"這\", \"塩\", \"載\", \"響\", \"辱\", \"仲\", \"毅\", \"・\", \" \", \"貞\", \"征\", \"饉\", \"基\", \"捐\", \"作\", \"琳\", \"査\", \"星\", \"笛\", \"脅\", \"社\", \"̀\", \"😢\", \"立\", \"得\", \"甲\", \"責\", \"縄\", \"嶽\", \"蔑\", \"寧\", \"促\", \"啓\", \"誘\", \"察\", \"窟\", \"到\", \"塔\", \"卵\", \"栃\", \"片\", \"頼\", \"Y\", \"契\", \"予\", \"ュ\", \"汎\", \"五\", \"位\", \"ゾ\", \"翔\", \"象\", \"碌\", \"低\", \"洗\", \"籠\", \"方\", \"&\", \"碓\", \"匿\", \"7\", \"斎\", \"浅\", \"幾\", \"際\", \"茫\", \"ザ\", \"羊\", \"μ\", \"覇\", \"漏\", \"株\", \"則\", \"堺\", \"頂\", \"塾\", \"実\", \"銃\", \"]\", \"挿\", \"g\", \"昂\", \"戴\", \"調\", \"底\", \"椒\", \"弁\", \"原\", \"泄\", \"廊\", \"庇\", \"権\", \"ち\", \"菅\", \"訂\", \"殿\", \"☆\", \"券\", \"4\", \"鮮\", \"メ\", \"那\", \"絆\", \"沢\", \"刃\", \"紫\", \"娘\", \"展\", \"婆\", \"千\", \"段\", \"♫\", \"嗚\", \"白\", \"氾\", \"穫\", \"性\", \"槽\", \"緑\", \"九\", \"新\", \"酷\", \"擦\", \"濫\", \"奇\", \"ㅂ\", \"珠\", \"諦\", \"晒\", \"始\", \"累\", \">\", \"請\", \"怯\", \"妥\", \"督\", \"僧\", \"墓\", \"残\", \"年\", \"薄\", \"爪\", \"必\", \"膝\", \"単\", \"忙\", \"汰\", \"O\", \"藤\", \"晴\", \"謬\", \"人\", \"還\", \"詠\", \"鯖\", \"w\", \"泰\", \"函\", \"式\", \"瘍\", \"疫\", \"炉\", \"米\", \"棲\", \"×\", \"険\", \"建\", \"で\", \"ボ\", \"つ\", \"ル\", \"菌\", \"鹿\", \"参\", \"國\", \"恣\", \"且\", \"+\", \"悟\", \"貝\", \"〜\", \"爽\", \"Ⅶ\", \"開\", \"輿\", \"偵\", \")\", \"贋\", \"王\", \"沸\", \"慨\", \"洒\", \"尖\", \"就\", \"醤\", \"酒\", \"贅\", \"滑\", \"酵\", \"赤\", \"8\", \"訝\", \"並\", \"掘\", \"湧\", \"斜\", \"揚\", \"内\", \"買\", \"朴\", \"簡\", \"闖\", \"降\", \"節\", \"卓\", \"活\", \"捩\", \"巣\", \"訳\", \"呑\", \"若\", \"宙\", \"格\", \"葵\", \"ぽ\", \"父\", \"件\", \"亀\", \"置\", \"誰\", \"軒\", \"助\", \"隣\", \"彡\", \"喜\", \"噴\", \"麹\", \"案\", \"伴\", \"致\", \"瞳\", \"雪\", \"タ\", \"《\", \"〝\", \"訪\", \"嘘\", \"坊\", \"沈\", \"遡\", \"吟\", \"只\", \"益\", \"樹\", \"、\", \"額\", \"料\", \"埃\", \"便\", \"掻\", \"%\", \"囁\", \"詮\", \"?\", \"死\", \"陛\", \"称\", \"賞\", \"騒\", \"エ\", \"斉\", \"秀\", \"プ\", \"肥\", \"呂\", \"洞\", \"須\", \"掲\", \"噂\", \"龍\", \"失\", \"湿\", \"稼\", \"夫\", \"養\", \"剰\", \"莫\", \"萼\", \"司\", \"港\", \"革\", \"撰\", \"黙\", \"競\", \"働\", \"筆\", \"烈\", \"昔\", \"舘\", \"規\", \"砦\", \"用\", \"研\", \"員\", \"弥\", \"屋\", \"循\", \"咎\", \"頻\", \"疹\", \"放\", \"拾\", \"簗\", \"斬\", \"$\", \"税\", \"計\", \"侵\", \"評\", \"麺\", \"湯\", \"口\", \"昇\", \"ヶ\", \"痢\", \"薙\", \"投\", \"\\", \"喫\", \"腹\", \"0\", \"写\", \"別\", \"斂\", \"垣\", \"E\", \"凪\", \"虎\", \"♪\", \"貧\", \"訃\", \"像\", \"覆\", \"祈\", \"貴\", \"稜\", \"頬\", \"釈\", \"琵\", \"楠\", \"浮\", \"飛\", \"眠\", \"脂\", \"宝\", \"脱\", \"智\", \"ス\", \"荘\", \"h\", \"な\", \"主\", \"姫\", \"ぶ\", \"ヨ\", \"旅\", \"透\", \"導\", \"処\", \"鍵\", \"娠\", \"躍\", \"識\", \"馬\", \"慄\", \"器\", \"坪\", \"義\", \"膜\", \"唇\", \"分\", \"走\", \"渉\", \"妨\", \"示\", \"老\", \"緯\", \"★\", \"幕\", \"壌\", \"衣\", \"ょ\", \"恵\", \"肺\", \"野\", \"醜\", \"転\", \"皿\", \"謝\", \"上\", \"択\", \"岸\", \"誠\", \"暮\", \"魔\", \"両\", \"L\", \"癖\", \"毛\", \"南\", \"湾\", \"袴\", \"旋\", \"控\", \"艸\", \"万\", \"瘻\", \"サ\", \"医\", \"窪\", \"硬\", \"禁\", \"肯\", \"衷\", \"治\", \"謙\", \"や\", \"頃\", \"訟\", \"鏡\", \"公\", \"林\", \"y\", \"斐\", \"阻\", \"歪\", \"畑\", \"披\", \"粧\", \"筋\", \"演\", \"ビ\", \"思\", \"縁\", \"曰\", \"侶\", \"梱\", \"ヨ\", \"(\", \"桑\", \"お\", \"姦\", \"読\", \"師\", \"ぷ\", \"貶\", \"静\", \"奔\", \"斧\", \"棟\", \"~\", \"瑞\", \"を\", \"汁\", \"伝\", \"祖\", \"蓮\", \"鶏\", \"滝\", \"埼\", \"⑪\", \"フ\", \"琉\", \"努\", \"セ\", \"紙\", \"初\", \"嬉\", \"皆\", \"飴\", \"‐\", \"祉\", \"工\", \"錠\", \"都\", \"妙\", \"根\", \"適\", \"骨\", \"張\", \"告\", \"統\", \"岡\", \"群\", \"鞘\", \"衰\", \"美\", \"s\", \"浣\", \"長\", \"翻\", \"ヾ\", \"🌙\", \"店\", \"析\", \"澄\", \"暫\", \"ヴ\", \"純\", \"御\", \"課\", \"鎖\", \"薪\", \"挙\", \"割\", \"妬\", \"求\", \"併\", \"闇\", \"ポ\", \"亜\", \"某\", \"蛋\", \"滲\", \"京\", \"介\", \"欲\", \"艶\", \"乃\", \"民\", \"皇\", \"画\", \"唸\", \"墜\", \"臓\", \"哀\", \"飽\", \"僚\", \"ゅ\", \"靴\", \"術\", \"遂\", \"果\", \"難\", \"築\", \"栗\", \"涙\", \"應\", \"凛\", \"苗\", \"|\", \"算\", \"β\", \"挟\", \"マ\", \"姉\", \"胆\", \"〕\", \";\", \"抹\", \"糸\", \"駅\", \"荷\", \"孫\", \"傾\", \"抽\", \"希\", \"陸\", \"措\", \"廉\", \"決\", \"蠍\", \"臥\", \"怖\", \"詳\", \"「\", \"収\", \"ノ\", \"族\", \"避\", \"操\", \"署\", \"茶\", \"\\u001b\", \"ミ\", \"久\", \"兵\", \"綴\", \"鳴\", \"跳\", \"迫\", \"罠\", \"元\", \"魂\", \"色\", \"首\", \"引\", \"代\", \"瞬\", \"級\", \"簿\", \"他\", \"邪\", \"拭\", \"無\", \"頓\", \"袋\", \"非\", \"怒\", \"謳\", \"突\", \"痴\", \"岩\", \"確\", \"恩\", \"レ\", \"緊\", \"蒸\", \"市\", \"賊\", \"゚\", \"願\", \"l\", \"雀\", \"灌\", \"堆\", \"<\", \"湖\", \"餃\", \"登\", \"̈\", \"究\", \"胃\", \"譜\", \"郵\", \"官\", \"項\", \"A\", \"瓶\", \"縛\", \"探\", \"佐\", \"村\", \"筈\", \"庶\", \"鴻\", \"耐\", \"也\", \"勤\", \"発\", \"畳\", \"拝\", \"戦\", \"篠\", \"忘\", \"婦\", \"映\", \"餅\", \"殻\", \"尺\", \"履\", \"役\", \"宴\", \"顕\", \"・\", \"Ⅱ\", \"*\", \"里\", \"枕\", \"志\", \"妄\", \"漬\", \"国\", \"撮\", \"ウ\", \"判\", \"黒\", \"談\", \"ひ\", \"辺\", \"今\", \"軽\", \"唱\", \"任\", \"潔\", \"曝\", \"喋\", \"緩\", \"既\", \"ハ\", \"`\", \"梓\", \"慢\", \"醸\", \"r\", \"シ\", \"双\", \"升\", \"可\", \"∀\", \"ケ\", \"試\", \"郎\", \"謗\", \"憶\", \"輔\", \"廃\", \"抗\", \"没\", \"鑑\", \"春\", \"耕\", \"巷\", \"烙\", \"栽\", \"崖\", \"俸\", \"豊\", \"6\", \"魚\", \"迦\", \"軍\", \"賢\", \"驚\", \"ヤ\", \"彼\", \"繊\", \"搭\", \"バ\", \"砂\", \"災\", \"爾\", \"″\", \"践\", \"蝋\", \"般\", \"攫\", \"惹\", \"命\", \"伊\", \"ど\", \"U\", \"一\", \"効\", \"招\", \"塚\", \":\", \"階\", \"フ\", \"皮\", \"盟\", \"ョ\", \"卒\", \"設\", \"チ\", \"做\", \"流\", \"泳\", \"前\", \"!\", \"嵐\", \"維\", \"最\", \"。\", \"😊\", \"暗\", \"奈\", \"筒\", \"旭\", \"ェ\", \"吾\", \"ん\", \"子\", \"提\", \"帝\", \"ウ\", \"山\", \"修\", \"枚\", \"デ\", \"裕\", \"程\", \"二\", \"礫\", \"素\", \"講\", \"㎞\", \"番\", \"又\", \"洩\", \"迭\", \"股\", \"沙\", \"渋\", \"央\", \"返\", \"略\", \"狩\", \"蛮\", \"拶\", \"満\", \"矢\", \"珂\", \"恰\", \"拗\", \"薦\", \"剃\", \"睡\", \"玉\", \"悪\", \"及\", \"踊\", \"批\", \"岳\", \"宅\", \"乳\", \"岐\", \"綱\", \"ヒ\", \"広\", \"徒\", \"磯\", \"●\", \"肢\", \"俊\", \"接\", \"卑\", \"杜\", \"落\", \"■\", \"跡\", \"忌\", \"務\", \"桜\", \"末\", \"以\", \"辿\", \"峰\", \"梶\", \"赦\", \"望\", \"遜\", \"劉\", \"涅\", \"漁\", \"虚\", \"道\", \"崔\", \"隠\", \"@\", \"餓\", \"囲\", \"紗\", \"ィ\", \"寡\", \"鳥\", \"肘\", \"琢\", \"軋\", \"っ\", \"捺\", \"図\", \"庄\", \"篤\", \"匹\", \"籍\", \"業\", \"閲\", \"泥\", \"、\", \"胞\", \"帳\", \"常\", \"三\", \"産\", \"癌\", \"ー\", \"安\", \"絨\", \"ヘ\", \"吹\", \"礼\", \"冊\", \"徴\", \"繍\", \"折\", \"篇\", \"吉\", \"花\", \"汚\", \"歩\", \"測\", \"牽\", \"ら\", \"土\", \"療\"]",
"reversible": false
},
"lmsys/fastchat-t5-3b-v1.0 @ cc100/ko": {
"tokenizer": "fastchat-t5-3b-v1.0",
"organization": "LMSYS",
"vocab_size": 32110,
"_n_bytes": 1524839,
"_n_tokens": 474953,
"_n_chars": 655190,
"_n_oov_chars": 432679,
"oov_ratio": 0.6603870632946168,
"_oov_charset": "[\"申\", \"칸\", \"었\", \"끄\", \"峴\", \"贖\", \"긴\", \"얘\", \"취\", \"液\", \"福\", \"흐\", \"ㆍ\", \"갉\", \"全\", \"팜\", \"맘\", \"낭\", \"땀\", \"龍\", \"슷\", \"햄\", \"굽\", \"잎\", \"ㅇ\", \"쏙\", \"꺽\", \"□\", \"法\", \"활\", \"좌\", \"부\", \"멤\", \"겔\", \"的\", \"갯\", \"쿵\", \"至\", \"달\", \"코\", \"름\", \"둬\", \"💸\", \"총\", \"젠\", \"웹\", \"情\", \"떡\", \"전\", \"헛\", \"뛸\", \"룸\", \"緞\", \"찮\", \"픔\", \"베\", \"왁\", \"켓\", \"줍\", \"罰\", \"본\", \"갭\", \"坐\", \"瀧\", \"멍\", \"찬\", \"燦\", \"압\", \"팔\", \"험\", \"랄\", \"썅\", \"랫\", \"ㅟ\", \"억\", \"뽀\", \"흥\", \"잦\", \"ㅏ\", \"침\", \"릉\", \"눈\", \"펴\", \"밋\", \"즙\", \"밥\", \"며\", \"안\", \"▣\", \"❤\", \"킴\", \"섭\", \"찜\", \"찼\", \"生\", \"肉\", \"희\", \"싶\", \"폰\", \"出\", \"슴\", \"🍕\", \"쌈\", \"격\", \"先\", \"面\", \"럽\", \"축\", \"뺀\", \"齋\", \"能\", \"명\", \"윌\", \"💕\", \"북\", \"효\", \"펄\", \"처\", \"뿔\", \"쯔\", \"섞\", \"겐\", \"띕\", \"에\", \"룬\", \"洋\", \"등\", \"제\", \"章\", \"뎅\", \"짢\", \"약\", \"手\", \"👨\", \"것\", \"껑\", \"팍\", \"빔\", \"쿠\", \"념\", \"캘\", \"者\", \"∙\", \"典\", \"뮈\", \"맞\", \"둘\", \"딜\", \"릴\", \"큰\", \"긍\", \"챙\", \"選\", \"탱\", \"낀\", \"㉿\", \"단\", \"즈\", \"랍\", \"맨\", \"솔\", \"大\", \"느\", \"머\", \"암\", \"男\", \"휘\", \"떻\", \"연\", \"敬\", \"납\", \"乙\", \"女\", \"허\", \"邑\", \"꾀\", \"史\", \"도\", \"커\", \"천\", \"跏\", \"ⓔ\", \"낱\", \"天\", \"쨍\", \"졌\", \"뼘\", \"數\", \"뜰\", \"烏\", \"홍\", \"듯\", \"뿌\", \"렐\", \"월\", \"불\", \"댔\", \"곁\", \"깃\", \"弟\", \"※\", \"솥\", \"장\", \"갖\", \"♤\", \"금\", \"씨\", \"꽁\", \"\", \"間\", \"녘\", \"범\", \"쟈\", \"회\", \"찰\", \"㉰\", \"너\", \"옌\", \"相\", \"雄\", \"색\", \"꺼\", \"秋\", \"흄\", \"\", \"겸\", \"房\", \"地\", \"下\", \"渴\", \"飾\", \"世\", \"뚫\", \"꿇\", \"닿\", \"ᴇ\", \"雲\", \"닦\", \"혜\", \"췌\", \"판\", \"淨\", \"🏷\", \"英\", \"램\", \"좇\", \"넌\", \"참\", \"茅\", \"고\", \"짬\", \"았\", \"벨\", \"땡\", \"멋\", \"형\", \"멀\", \"빌\", \"없\", \"칫\", \"춥\", \"튜\", \"➊\", \"다\", \"⑨\", \"臺\", \"邦\", \"폿\", \"七\", \"써\", \"원\", \"책\", \"팥\", \"貸\", \"르\", \"폼\", \"궁\", \"之\", \"古\", \"신\", \"객\", \"壞\", \"륜\", \"깨\", \"≫\", \"交\", \"탐\", \"당\", \"울\", \"蟄\", \"볕\", \"툭\", \"샬\", \"위\", \"풋\", \"흡\", \"띄\", \"룡\", \"잇\", \"할\", \"高\", \"툰\", \"멸\", \"잣\", \"큽\", \"밍\", \"셈\", \"勢\", \"롤\", \"쥰\", \"담\", \"利\", \"답\", \"⑵\", \"빅\", \"젝\", \"빼\", \"ㅍ\", \"껍\", \"퇴\", \"聖\", \"션\", \"솨\", \"團\", \"깜\", \"율\", \"後\", \"겪\", \"그\", \"回\", \"듬\", \"샤\", \"륭\", \"절\", \"씻\", \"←\", \"🗺\", \"렴\", \"컷\", \"現\", \"막\", \"◐\", \"何\", \"文\", \"헝\", \"돕\", \"않\", \"탑\", \"‧\", \"눴\", \"擒\", \"듭\", \"떤\", \"氷\", \"풍\", \"멘\", \"빴\", \"す\", \"ㅑ\", \"펜\", \"괄\", \"엉\", \"딴\", \"·\", \"셰\", \"合\", \"민\", \"플\", \"촬\", \"價\", \"덜\", \"뱀\", \"놔\", \"옥\", \"ㅖ\", \"닝\", \"쿨\", \"水\", \"거\", \"中\", \"훔\", \"留\", \"지\", \"톨\", \"테\", \"平\", \"明\", \"述\", \"ㄴ\", \"훌\", \"핍\", \"윗\", \"점\", \"댈\", \"農\", \"률\", \"논\", \"技\", \"🍞\", \"쯤\", \"빚\", \"月\", \"斗\", \"쉼\", \"禮\", \"냐\", \"합\", \"아\", \"💦\", \"八\", \"골\", \"毒\", \"뜨\", \"둥\", \"黃\", \"한\", \"끙\", \"解\", \"즘\", \"正\", \"띤\", \"➎\", \"젖\", \"묶\", \"韓\", \"妻\", \"臀\", \"谷\", \"온\", \"病\", \"근\", \"特\", \"찾\", \"얍\", \"存\", \"○\", \"包\", \"오\", \"사\", \"되\", \"Ⅴ\", \"꿍\", \"륙\", \"立\", \"類\", \"삣\", \"ᴍ\", \"응\", \"티\", \"왔\", \"짠\", \"🍔\", \"陽\", \"結\", \"副\", \"혐\", \"界\", \"‥\", \"굶\", \"습\", \"🍭\", \"係\", \"科\", \"❏\", \"낯\", \"려\", \"竹\", \"삭\", \"廟\", \"밀\", \"물\", \"居\", \"떠\", \"걍\", \"宋\", \"Ⅸ\", \"닫\", \"理\", \"行\", \"엌\", \"떼\", \"상\", \"눅\", \"꽉\", \"퀘\", \"펠\", \"보\", \"받\", \"웬\", \"밧\", \"¹\", \"Ⅳ\", \"킁\", \"둔\", \"초\", \"뭉\", \"光\", \"悧\", \"💌\", \"왕\", \"겟\", \"♥\", \"께\", \"첫\", \"훑\", \"ㄹ\", \"왼\", \"링\", \"펼\", \"💡\", \"」\", \"넷\", \"챨\", \"蜀\", \"썰\", \"학\", \"씀\", \"布\", \"멈\", \"【\", \"♣\", \"렇\", \"©\", \"짝\", \"字\", \"參\", \"녕\", \"쪽\", \"뭔\", \"죤\", \"淘\", \"떨\", \"學\", \"있\", \"궐\", \"렜\", \"쌉\", \"짚\", \"🌳\", \"몰\", \"笠\", \"守\", \"듈\", \"☎\", \"쏠\", \"츠\", \"붙\", \"쟁\", \"갱\", \"낫\", \"요\", \"훼\", \"췄\", \"向\", \"韜\", \"릭\", \"꿀\", \"죄\", \"🤟\", \"歲\", \"ㅚ\", \"ⅲ\", \"칠\", \"잼\", \"흙\", \"꺄\", \"엑\", \"킌\", \"덧\", \"욜\", \"잉\", \"◇\", \"죠\", \"긋\", \"챔\", \"벽\", \"헉\", \"재\", \"쎈\", \"양\", \"換\", \"푼\", \"웠\", \"➏\", \"워\", \"펌\", \"체\", \"⑴\", \"ω\", \"닥\", \"누\", \"뤘\", \"窮\", \"툼\", \"⬇\", \"意\", \"팰\", \"옵\", \"낼\", \"쓸\", \"題\", \"否\", \"▷\", \"ㅗ\", \"듐\", \"ⅳ\", \"디\", \"감\", \"늘\", \"將\", \"目\", \"러\", \"계\", \"솜\", \"語\", \"婚\", \"拮\", \"漢\", \"될\", \"뛴\", \"슝\", \"콕\", \"🙆\", \"武\", \"會\", \"캄\", \"봇\", \"뻑\", \"뀐\", \"롭\", \"쌩\", \"「\", \"海\", \"과\", \"琪\", \"〔\", \"딥\", \"ㅘ\", \"途\", \"掌\", \"퉁\", \"賣\", \"횟\", \"든\", \"굵\", \"⑧\", \"💰\", \"벅\", \"똘\", \"액\", \"℃\", \"넵\", \"읍\", \"쉘\", \"壽\", \"셜\", \"峙\", \"카\", \"宮\", \"靑\", \"끗\", \"듀\", \"序\", \"능\", \"華\", \"퀀\", \"마\", \"쟤\", \"ɪ\", \"誡\", \"깥\", \"릿\", \"끼\", \"槪\", \"놓\", \"꿨\", \"얕\", \"삿\", \"샌\", \"ㅒ\", \"석\", \"국\", \"턴\", \"엣\", \"겨\", \"역\", \"卽\", \"藥\", \"탈\", \"끊\", \"펀\", \"經\", \"겠\", \"만\", \"렛\", \"드\", \"섣\", \"콩\", \"캉\", \"칭\", \"뺏\", \"탁\", \"앞\", \"땐\", \"直\", \"꾸\", \"쉰\", \"빠\", \"숙\", \"섰\", \"뼈\", \"協\", \"핵\", \"괌\", \"슨\", \"댐\", \"씬\", \"曆\", \"첩\", \"어\", \"多\", \"했\", \"냥\", \"건\", \"걷\", \"크\", \"才\", \"창\", \"좁\", \"冬\", \"룩\", \"승\", \"런\", \"뮌\", \"세\", \"촌\", \"뜩\", \"곰\", \"荻\", \"호\", \"種\", \"음\", \"깅\", \"拘\", \"院\", \"식\", \"샴\", \"뭐\", \"펩\", \"딩\", \"팠\", \"쒀\", \"영\", \"뚜\", \"벳\", \"친\", \"랜\", \"빗\", \"셔\", \"Ⅹ\", \"둑\", \"︎\", \"奉\", \"항\", \"휠\", \"쫄\", \"인\", \"±\", \"姜\", \"품\", \"갇\", \"쨌\", \"녁\", \"쁘\", \"롱\", \"뮬\", \"뻐\", \"꿰\", \"◦\", \"同\", \"』\", \"팁\", \"商\", \"몬\", \"ᴡ\", \"◎\", \"템\", \"틸\", \"有\", \"⁴\", \"져\", \"덟\", \"랙\", \"뿜\", \"익\", \"滅\", \"류\", \"堂\", \"증\", \"잰\", \"켐\", \"횡\", \"極\", \"얽\", \"렀\", \"꽝\", \"쏭\", \"방\", \"갚\", \"吳\", \"넹\", \"榜\", \"털\", \"복\", \"知\", \"텨\", \"욱\", \"기\", \"봅\", \"昭\", \"향\", \"칩\", \"견\", \"락\", \"콥\", \"옳\", \"엇\", \"信\", \"림\", \"故\", \"핀\", \"ㅈ\", \"녹\", \"소\", \"널\", \"標\", \"벵\", \"쾅\", \"城\", \"制\", \"》\", \"귀\", \"십\", \"🌿\", \"😣\", \"떳\", \"…\", \"윤\", \"났\", \"졸\", \"⇒\", \"툴\", \"🤕\", \"잤\", \"렸\", \"넨\", \"셨\", \"뜻\", \"🏫\", \"묻\", \"🦅\", \"濟\", \"두\", \"ⅱ\", \"言\", \"🚨\", \"귤\", \"〈\", \"끈\", \"心\", \"악\", \"집\", \"뜸\", \"쪄\", \"―\", \"숫\", \"金\", \"紋\", \"授\", \"友\", \"선\", \"줄\", \"헐\", \"夜\", \"①\", \"☀\", \"클\", \"뫼\", \"튼\", \"꿈\", \"컵\", \"궜\", \"덴\", \"し\", \"↓\", \"묵\", \"을\", \"키\", \"『\", \"줘\", \"뭇\", \"표\", \"킨\", \"穀\", \"戮\", \"駐\", \"🦄\", \"朝\", \"홉\", \"돌\", \"젤\", \"잊\", \"꾼\", \"씽\", \"귈\", \"숨\", \"뢰\", \"존\", \"쳐\", \"넬\", \"륨\", \"쑤\", \"태\", \"康\", \"욕\", \"럿\", \"射\", \"닷\", \"發\", \"詔\", \"陳\", \"델\", \"밉\", \"로\", \"쉬\", \"톡\", \"헬\", \"弊\", \"셉\", \"🍰\", \"갤\", \"캠\", \"앓\", \"후\", \"확\", \"頭\", \"ㅜ\", \"鐘\", \"六\", \"뺐\", \"봤\", \"결\", \"른\", \"녀\", \"🌵\", \"枯\", \"히\", \"해\", \"구\", \"て\", \"무\", \"켄\", \"략\", \"힉\", \"낡\", \"江\", \"巡\", \"춰\", \"뇌\", \"맡\", \"퀸\", \"不\", \"균\", \"타\", \"政\", \"완\", \"管\", \"곤\", \"侯\", \"飮\", \"때\", \"데\", \"川\", \"팬\", \"둡\", \"外\", \"냈\", \"교\", \"觸\", \"찔\", \"콜\", \"대\", \"덤\", \"임\", \"텅\", \"옮\", \"최\", \"쫀\", \"∼\", \"가\", \"樂\", \"亭\", \"�\", \"눠\", \"․\", \"§\", \"튀\", \"출\", \"즉\", \"군\", \"님\", \"~\", \"끝\", \"딤\", \"문\", \"쪼\", \"⑦\", \"時\", \"봄\", \"곽\", \"쥐\", \"착\", \"論\", \"ㅣ\", \"섹\", \"맛\", \"컨\", \"唐\", \"共\", \"뗀\", \"숯\", \"홀\", \"벚\", \"릇\", \"녔\", \"깔\", \"흑\", \"햇\", \"왠\", \"第\", \"改\", \"쌓\", \"먼\", \"被\", \"돗\", \"앵\", \"德\", \"짜\", \"네\", \"폍\", \"貿\", \"津\", \"올\", \"얻\", \"헨\", \"혼\", \"걀\", \"東\", \"엄\", \"록\", \"衛\", \"걸\", \"쫓\", \"샵\", \"내\", \"팩\", \"孝\", \"륵\", \"갈\", \"굿\", \"➍\", \"」\", \"㎡\", \"摩\", \"⑶\", \"事\", \"텁\", \"쓰\", \"動\", \"\", \"턱\", \"ᴛ\", \"警\", \"준\", \"쩌\", \"蚩\", \"ᴏ\", \"닙\", \"劍\", \"유\", \"俗\", \"比\", \"흘\", \"ㅞ\", \"◆\", \"엠\", \"關\", \"綃\", \"好\", \"짭\", \"銀\", \"튠\", \"움\", \"앉\", \"蒙\", \"엿\", \"ᴀ\", \"흔\", \"앗\", \"척\", \"괴\", \"쓴\", \"눔\", \"우\", \"둠\", \"は\", \"멜\", \"眞\", \"첨\", \"씌\", \"金\", \"〮\", \"탓\", \"까\", \"서\", \"켤\", \"👋\", \"Ⅵ\", \"줏\", \"현\", \"뱅\", \"시\", \"밖\", \"웁\", \"️\", \"◼\", \"然\", \"弛\", \"뀔\", \"쐐\", \"됨\", \"ㅅ\", \"게\", \"낮\", \"角\", \"댄\", \"푹\", \"✈\", \"먹\", \"🤭\", \"犬\", \"②\", \"家\", \"뿍\", \"뱉\", \"쁜\", \"➌\", \"경\", \"ㅕ\", \"쉴\", \"理\", \"섯\", \"츈\", \"뮤\", \"愛\", \"璿\", \"넥\", \"야\", \"뽐\", \"입\", \"꿕\", \"및\", \"터\", \"퍽\", \"운\", \"픽\", \"팹\", \"紀\", \"祐\", \"㈜\", \"짙\", \"팝\", \"쿰\", \"童\", \"食\", \"캡\", \"系\", \"寛\", \"🙋\", \"💣\", \"榮\", \"徳\", \"十\", \"팟\", \"혔\", \"쏘\", \"싯\", \"광\", \"】\", \"들\", \"용\", \"잔\", \"뉘\", \"김\", \"듣\", \"룰\", \"뤄\", \"랑\", \"줌\", \"닛\", \"꼈\", \"람\", \"껏\", \"숏\", \"새\", \"宗\", \"잖\", \"己\", \"門\", \"そ\", \"난\", \"쁠\", \"엔\", \"관\", \"㎍\", \"良\", \"일\", \"뻤\", \"립\", \"兄\", \"첸\", \"벗\", \"璣\", \"쭉\", \"맹\", \"흰\", \"集\", \"ㄷ\", \"앙\", \"仁\", \"하\", \"긁\", \"次\", \"⚀\", \"資\", \"함\", \"봬\", \"客\", \"징\", \"삽\", \"巳\", \"칙\", \"덕\", \"웍\", \"렉\", \"킬\", \"몫\", \"펙\", \"所\", \"火\", \"으\", \"래\", \"뛰\", \"값\", \"늬\", \"樺\", \"쭙\", \"딱\", \"엽\", \"따\", \"😭\", \"띠\", \"燭\", \"◾\", \"뜹\", \"깊\", \"넘\", \"탠\", \"쫒\", \"씹\", \"동\", \"촛\", \"尤\", \"촉\", \"離\", \"꼽\", \"찌\", \"흩\", \"女\", \"💅\", \"셸\", \"돔\", \"뇨\", \"냉\", \"궤\", \"뒀\", \"똥\", \"텍\", \"옐\", \"켈\", \"톰\", \"㎥\", \"럼\", \"넣\", \"反\", \"和\", \"部\", \"化\", \"겼\", \"돠\", \"쿼\", \"숍\", \"폈\", \"굉\", \"덮\", \"닉\", \"샐\", \"훗\", \"핫\", \"렷\", \"뿐\", \"俠\", \"맑\", \"陰\", \"→\", \"깁\", \"픕\", \"짐\", \"훈\", \"㏊\", \"프\", \"톱\", \"神\", \"껀\", \"北\", \"④\", \"흗\", \"뭘\", \"🤗\", \"겹\", \"번\", \"탕\", \"킹\", \"ㅝ\", \"▶\", \"▼\", \"힙\", \"브\", \"└\", \"핥\", \"機\", \"층\", \"니\", \"땠\", \"열\", \"읊\", \"를\", \"바\", \"永\", \"늄\", \"나\", \"자\", \"얏\", \"땅\", \"殺\", \"핸\", \"심\", \"반\", \"△\", \"폄\", \"善\", \"찢\", \"뒤\", \"日\", \"↕\", \"롬\", \"던\", \"닮\", \"쿄\", \"\", \"트\", \"미\", \"빳\", \"趺\", \"③\", \"밤\", \"뎀\", \"書\", \"い\", \"좆\", \"녜\", \"은\", \"팀\", \"♡\", \"걔\", \"벼\", \"와\", \"易\", \"끔\", \"낍\", \"識\", \"벤\", \"쩔\", \"백\", \"辰\", \"君\", \"예\", \"왜\", \"自\", \"ㅙ\", \"밴\", \"衡\", \"셋\", \"⑥\", \"힌\", \"Ⅷ\", \"묘\", \"샘\", \"년\", \"〉\", \"草\", \"박\", \"질\", \"쩐\", \"說\", \"틋\", \"↑\", \"딪\", \"百\", \"ㅛ\", \"글\", \"맥\", \"버\", \"載\", \"렬\", \"ʟ\", \"仲\", \"웰\", \"곧\", \" \", \"諒\", \"・\", \"탭\", \"뀌\", \"ⅰ\", \"배\", \"星\", \"Ⅰ\", \"社\", \"쏜\", \"立\", \"밭\", \"싫\", \"拜\", \"甲\", \"v\", \"셌\", \"悖\", \"슐\", \"≤\", \"노\", \"수\", \"밟\", \"엮\", \"쭈\", \"홑\", \"五\", \"텔\", \"즌\", \"劫\", \"순\", \"족\", \"꼬\", \"량\", \"쌀\", \"方\", \"병\", \"냅\", \"끌\", \"밝\", \"밌\", \"붓\", \"😂\", \"쎄\", \"별\", \"닭\", \"득\", \"雙\", \"퀄\", \"ⓒ\", \"높\", \"際\", \"μ\", \"극\", \"왓\", \"됩\", \"촘\", \"갔\", \"흉\", \"짤\", \"팎\", \"행\", \"팽\", \"날\", \"필\", \"콰\", \"쫑\", \"썬\", \"읽\", \"뵙\", \"넓\", \"原\", \"강\", \"급\", \"술\", \"☆\", \"얼\", \"꿔\", \"힜\", \"ㅠ\", \"통\", \"鮮\", \"캣\", \"◈\", \"엡\", \"농\", \"간\", \"분\", \"낳\", \"황\", \"꽂\", \"탄\", \"솟\", \"白\", \"性\", \"쇠\", \"α\", \"ㅐ\", \"잴\", \"겉\", \"新\", \"九\", \"슬\", \"屠\", \"꽃\", \"始\", \"쐬\", \"실\", \"뾱\", \"\", \"퀴\", \"年\", \"薄\", \"큐\", \"汰\", \"므\", \"뚝\", \"藝\", \"닳\", \"똑\", \"맴\", \"푸\", \"人\", \"몹\", \"堯\", \"詠\", \"\", \"쌍\", \"패\", \"법\", \"흠\", \"쉽\", \"킥\", \"米\", \"헤\", \"ㅡ\", \"×\", \"뺑\", \"몸\", \"냠\", \"홈\", \"⑸\", \"웖\", \"면\", \"國\", \"말\", \"찍\", \"츄\", \"맺\", \"퍙\", \"탬\", \"體\", \"작\", \"뜯\", \"◀\", \"깽\", \"靈\", \"는\", \"Ⅶ\", \"청\", \"랬\", \"붐\", \"🍟\", \"틔\", \"눕\", \"對\", \"王\", \"빈\", \"쳤\", \"좀\", \"진\", \"옆\", \"혁\", \"겁\", \"假\", \"믐\", \"칼\", \"쥬\", \"삐\", \"딸\", \"캔\", \"혀\", \"짓\", \"節\", \"붕\", \"피\", \"적\", \"譯\", \"👏\", \"▲\", \"걱\", \"맬\", \"볍\", \"훨\", \"왘\", \"같\", \"볼\", \"뉜\", \"차\", \"軒\", \"⑹\", \"저\", \"致\", \"㉠\", \"ㅊ\", \"덥\", \"雪\", \"짊\", \"됐\", \"《\", \"산\", \"잃\", \"싱\", \"검\", \"캐\", \"폐\", \"累\", \"춘\", \"❍\", \"樹\", \"짖\", \"랭\", \"렁\", \"페\", \"料\", \"픈\", \"뷔\", \"獻\", \"%\", \"슈\", \"옛\", \"낚\", \"?\", \"死\", \"잡\", \"린\", \"ㅎ\", \"낸\", \"종\", \"옴\", \"앰\", \"살\", \"氣\", \"洞\", \"쾌\", \"뜬\", \"龍\", \"ㅔ\", \"삘\", \"쿡\", \"革\", \"⋅\", \"훅\", \"갑\", \"옹\", \"정\", \"빡\", \"괜\", \"ㅋ\", \"ㄱ\", \"즐\", \"👍\", \"ᴄ\", \"윈\", \"쫗\", \"쇄\", \"넉\", \"用\", \"앨\", \"빵\", \"員\", \"추\", \"ㅓ\", \"♧\", \"섦\", \"口\", \"칵\", \"投\", \"텝\", \"🙌\", \"깐\", \"빨\", \"놈\", \"롸\", \"♪\", \"늙\", \"像\", \"覆\", \"뒷\", \"망\", \"킵\", \"샀\", \"ã\", \"공\", \"🏻\", \"힐\", \"脱\", \"또\", \"內\", \"닌\", \"ㅁ\", \"㉣\", \"主\", \"론\", \"발\", \"늑\", \"빕\", \"굴\", \"됬\", \"分\", \"싹\", \"접\", \"🥁\", \"핑\", \"🤔\", \"딛\", \"★\", \"衣\", \"野\", \"권\", \"⊙\", \"옷\", \"謝\", \"上\", \"꺾\", \"맵\", \"슛\", \"텀\", \"魔\", \"설\", \"블\", \"💥\", \"쑥\", \"였\", \"南\", \"毛\", \"못\", \"삶\", \"♀\", \"쏟\", \"🍎\", \"렘\", \"틴\", \"벙\", \"직\", \"럭\", \"治\", \"협\", \"줬\", \"촨\", \"싸\", \"公\", \"쇼\", \"컸\", \"林\", \"陸\", \"댓\", \"🚿\", \"퀵\", \"끓\", \"씩\", \"思\", \"충\", \"획\", \"曰\", \"모\", \"꼭\", \"✔\", \"휴\", \"눌\", \"師\", \"깡\", \"뻗\", \"톤\", \"욥\", \"樂\", \"퍼\", \"쾨\", \"껴\", \"쩍\", \"놀\", \"훠\", \"폴\", \"짱\", \"튿\", \"춤\", \"\", \"빤\", \"낌\", \"紙\", \"初\", \"랴\", \"↔\", \"켰\", \"∮\", \"딧\", \"祉\", \"뱃\", \"工\", \"염\", \"스\", \"떄\", \"適\", \"뤼\", \"케\", \"랐\", \"갓\", \"戌\", \"포\", \"群\", \"변\", \"美\", \"s\", \"長\", \"析\", \"남\", \"몽\", \"첼\", \"御\", \"課\", \"철\", \"섬\", \"굳\", \"랩\", \"혈\", \"윙\", \"목\", \"퓨\", \"펑\", \"求\", \"힘\", \"얀\", \"릅\", \"某\", \"ㅢ\", \"곡\", \"몇\", \"京\", \"놨\", \"밸\", \"렵\", \"乃\", \"民\", \"²\", \"皇\", \"언\", \"컬\", \"낙\", \"틱\", \"측\", \"哀\", \"朱\", \"벌\", \"術\", \"流\", \"應\", \"뭥\", \"휩\", \"|\", \"력\", \"胡\", \"루\", \"〕\", \"센\", \"곱\", \"숟\", \"챌\", \"맷\", \"臥\", \"≪\", \"외\", \"업\", \"「\", \"쓕\", \"族\", \"썹\", \"길\", \"삼\", \"롯\", \"븐\", \"앤\", \"➋\", \"냄\", \"싼\", \"뉴\", \"딘\", \"좋\", \"獨\", \"토\", \"젊\", \"썩\", \"色\", \"代\", \"쳇\", \"채\", \"컴\", \"튬\", \"혹\", \"無\", \"變\", \"웃\", \"닐\", \"봐\", \"챗\", \"샷\", \"잘\", \"돋\", \"꽤\", \"례\", \"쿤\", \"웅\", \"앱\", \"켠\", \"🔹\", \"梁\", \"째\", \"곳\", \"럴\", \"파\", \"튄\", \"앎\", \"맙\", \"메\", \"숱\", \"비\", \"렌\", \"봉\", \"밑\", \"련\", \"켜\", \"이\", \"콘\", \"콤\", \"잭\", \"戊\", \"틀\", \"깝\", \"믹\", \"매\", \"웨\", \"얇\", \"敎\", \"싣\", \"Ⅲ\", \"ㅆ\", \"조\", \"얹\", \"멕\", \"뮐\", \"뷰\", \"손\", \"엘\", \"Ⅱ\", \"*\", \"평\", \"里\", \"릎\", \"주\", \"志\", \"鎭\", \"잠\", \"떴\", \"궈\", \"썼\", \"꼴\", \"實\", \"돼\", \"›\", \"짧\", \"편\", \"얄\", \"퓰\", \"룹\", \"😗\", \"뽑\", \"쬐\", \"可\", \"죽\", \"속\", \"셀\", \"抗\", \"송\", \"亨\", \"여\", \"春\", \"耕\", \"魯\", \"큼\", \"애\", \"란\", \"투\", \"령\", \"치\", \"화\", \"魚\", \"軍\", \"특\", \"빙\", \"성\", \"驚\", \"레\", \"띈\", \"틈\", \"命\", \"의\", \"\", \"덩\", \"一\", \"믄\", \"료\", \"알\", \":\", \"😱\", \"핏\", \"盟\", \"皮\", \"넛\", \"卒\", \"◑\", \"탰\", \"댁\", \"。\", \"😊\", \"팡\", \"독\", \"子\", \"帝\", \"갛\", \"濁\", \"홋\", \"텐\", \"修\", \"山\", \"숲\", \"☞\", \"程\", \"된\", \"빛\", \"㎞\", \"낄\", \"붉\", \"略\", \"玉\", \"캇\", \"젓\", \"썸\", \"▒\", \"乳\", \"●\", \"쩡\", \"늦\", \"샹\", \"不\", \"믿\", \"헌\", \"⑤\", \"■\", \"돈\", \"專\", \"춧\", \"중\", \"육\", \"峰\", \"휙\", \"엎\", \"쵸\", \"각\", \"望\", \"더\", \"규\", \"쁨\", \"道\", \"끽\", \"@\", \"폭\", \"숭\", \"곶\", \"🙇\", \"환\", \"택\", \"팅\", \"볶\", \"籍\", \"業\", \"ʏ\", \"常\", \"三\", \"呪\", \"쥔\", \"安\", \"리\", \"뻔\", \"풀\", \"개\", \"뵐\", \"많\", \"ń\", \"킷\", \"생\", \"융\", \"라\", \"土\"]",
"reversible": false
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ar": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2813283,
"_n_tokens": 1422081,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/de": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1814876,
"_n_tokens": 527320,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/en": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1124813,
"_n_tokens": 284627,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/es": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1664455,
"_n_tokens": 482235,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/fa": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2054052,
"_n_tokens": 1145076,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/fr": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1540504,
"_n_tokens": 447243,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ja": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1774770,
"_n_tokens": 718461,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/ko": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 1524839,
"_n_tokens": 954428,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/Phi-3-mini-4k-instruct @ cc100/zh-Hans": {
"tokenizer": "Phi-3-mini-4k-instruct",
"organization": "Microsoft",
"vocab_size": 32011,
"_n_bytes": 2633047,
"_n_tokens": 1320093,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"microsoft/phi-1 @ cc100/ar": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/de": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1814876,
"_n_tokens": 684665,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/en": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1124813,
"_n_tokens": 258409,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/es": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/fa": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"microsoft/phi-1 @ cc100/fr": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/ja": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"microsoft/phi-1 @ cc100/ko": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1524839,
"_n_tokens": 1308988,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-1 @ cc100/zh-Hans": {
"tokenizer": "phi-1",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"microsoft/phi-2 @ cc100/ar": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/de": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1814876,
"_n_tokens": 684665,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/en": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1124813,
"_n_tokens": 258409,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/es": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/fa": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"microsoft/phi-2 @ cc100/fr": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/ja": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"microsoft/phi-2 @ cc100/ko": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 1524839,
"_n_tokens": 1308988,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"microsoft/phi-2 @ cc100/zh-Hans": {
"tokenizer": "phi-2",
"organization": "Microsoft",
"vocab_size": 50295,
"_n_bytes": 2633047,
"_n_tokens": 1876809,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"mistralai/Mistral-7B-v0.1 @ cc100/ar": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/de": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/en": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/es": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/fa": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/fr": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/ja": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/ko": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mistral-7B-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Mistral-7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ar": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 1396319,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/de": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 567526,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/en": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 275801,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/es": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 503915,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/fa": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 1123278,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/fr": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 466666,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ja": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 675134,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/ko": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 718766,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"mistralai/Mixtral-8x7B-v0.1 @ cc100/zh-Hans": {
"tokenizer": "Mixtral-8x7B-v0.1",
"organization": "Mistral",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 1031023,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai-community/gpt2 @ cc100/ar": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai-community/gpt2 @ cc100/de": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1814876,
"_n_tokens": 684669,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai-community/gpt2 @ cc100/es": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai-community/gpt2 @ cc100/fa": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"openai-community/gpt2 @ cc100/fr": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai-community/gpt2 @ cc100/ja": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"openai-community/gpt2 @ cc100/ko": {
"tokenizer": "gpt2",
"organization": "OpenAI",
"vocab_size": 50257,
"_n_bytes": 1524839,
"_n_tokens": 1309029,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"openai/code-davinci-002 @ cc100/ar": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/de": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1814876,
"_n_tokens": 684666,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/es": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/fa": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/fr": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/ja": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/code-davinci-002 @ cc100/ko": {
"tokenizer": "code-davinci-002",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1524839,
"_n_tokens": 1308993,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/ar": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/de": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/es": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/fa": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/fr": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/ja": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-3.5-turbo @ cc100/ko": {
"tokenizer": "gpt-3.5-turbo",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/ar": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2813283,
"_n_tokens": 1105640,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/de": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1814876,
"_n_tokens": 500870,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/es": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1664455,
"_n_tokens": 433875,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/fa": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 2054052,
"_n_tokens": 818067,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/fr": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1540504,
"_n_tokens": 412685,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/ja": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1774770,
"_n_tokens": 630348,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4 @ cc100/ko": {
"tokenizer": "gpt-4",
"organization": "OpenAI",
"vocab_size": 100277,
"_n_bytes": 1524839,
"_n_tokens": 652277,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/ar": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2813283,
"_n_tokens": 514909,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/de": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1814876,
"_n_tokens": 412599,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/es": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1664455,
"_n_tokens": 367655,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/fa": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 2054052,
"_n_tokens": 379156,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/fr": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1540504,
"_n_tokens": 353101,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/ja": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1774770,
"_n_tokens": 452794,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/gpt-4o @ cc100/ko": {
"tokenizer": "gpt-4o",
"organization": "OpenAI",
"vocab_size": 200019,
"_n_bytes": 1524839,
"_n_tokens": 405624,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/ar": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2813283,
"_n_tokens": 1558111,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/de": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1814876,
"_n_tokens": 684666,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/es": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1664455,
"_n_tokens": 569853,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/fa": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 2054052,
"_n_tokens": 1292300,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/fr": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1540504,
"_n_tokens": 521776,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/ja": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1774770,
"_n_tokens": 844362,
"_n_chars": 603065,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"openai/text-davinci-003 @ cc100/ko": {
"tokenizer": "text-davinci-003",
"organization": "OpenAI",
"vocab_size": 50281,
"_n_bytes": 1524839,
"_n_tokens": 1308993,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"paust/pko-t5-large @ cc100/ar": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2813283,
"_n_tokens": 2805586,
"_n_chars": 1560987,
"_n_oov_chars": 202,
"oov_ratio": 0.00012940530574565964,
"_oov_charset": "[\"½\", \"ﻷ\", \"ﻹ\", \"ﷺ\", \"″\", \"ﻻ\", \"…\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/de": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1814876,
"_n_tokens": 1244350,
"_n_chars": 1784021,
"_n_oov_chars": 484,
"oov_ratio": 0.0002712972549089949,
"_oov_charset": "[\"²\", \"½\", \" \", \"u\", \"™\", \"¼\", \"̈\", \"´\", \"¹\", \"…\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/es": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1664455,
"_n_tokens": 1124056,
"_n_chars": 1630297,
"_n_oov_chars": 528,
"oov_ratio": 0.0003238673689517922,
"_oov_charset": "[\"²\", \"ª\", \"º\", \"″\", \"´\", \"…\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/fa": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 2054052,
"_n_tokens": 2051040,
"_n_chars": 1145876,
"_n_oov_chars": 606,
"oov_ratio": 0.0005288530347088167,
"_oov_charset": "[\"ﮧ\", \"…\", \" \"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/fr": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1540504,
"_n_tokens": 1034665,
"_n_chars": 1484970,
"_n_oov_chars": 864,
"oov_ratio": 0.0005818299359583021,
"_oov_charset": "[\"²\", \"µ\", \"̧\", \"™\", \"″\", \"℃\", \"´\", \"̂\", \"́\", \"…\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/ja": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1774770,
"_n_tokens": 1756950,
"_n_chars": 603065,
"_n_oov_chars": 7382,
"oov_ratio": 0.012240803230165902,
"_oov_charset": "[\"T\", \"d\", \"I\", \"レ\", \"⑩\", \"b\", \"カ\", \"。\", \"Q\", \"゙\", \"H\", \"N\", \"ー\", \"]\", \"g\", \"1\", \"6\", \"か\", \"せ\", \"Z\", \".\", \"/\", \"|\", \"¥\", \"″\", \"V\", \"L\", \"メ\", \"k\", \"m\", \";\", \"U\", \"4\", \"゚\", \",\", \":\", \"フ\", \"テ\", \"S\", \"…\", \"ノ\", \"③\", \"%\", \"!\", \"?\", \"く\", \"は\", \"ㅂ\", \"y\", \"=\", \"2\", \">\", \"9\", \"ロ\", \"‥\", \"コ\", \"㎞\", \"ハ\", \"-\", \"(\", \"o\", \"ト\", \"O\", \"゚\", \"①\", \"l\", \"<\", \"_\", \"a\", \"ヒ\", \"~\", \" ̄\", \"w\", \"し\", \"゙\", \"$\", \"A\", \"F\", \"G\", \"P\", \"W\", \"コ\", \"⑪\", \"フ\", \"つ\", \"\\", \"e\", \"ゥ\", \"0\", \"Ⅹ\", \"②\", \"B\", \"ィ\", \"D\", \"´\", \"「\", \"+\", \"C\", \"E\", \"M\", \"t\", \"‼\", \"ふ\", \" \", \"・\", \"Ⅶ\", \"へ\", \"た\", \"ア\", \"」\", \"Ⅱ\", \"*\", \"@\", \"と\", \"⑧\", \")\", \"X\", \"℃\", \" \", \"ス\", \"s\", \"i\", \"h\", \"ウ\", \"リ\", \"J\", \"す\", \"[\", \"、\", \"ヨ\", \"ひ\", \"④\", \"Y\", \"8\", \"^\", \"5\", \"ハ\", \"ヘ\", \"`\", \"3\", \"r\", \"n\", \"シ\", \"ホ\", \"R\", \"K\", \"&\", \"て\", \"f\", \"7\"]",
"reversible": false
},
"paust/pko-t5-large @ cc100/ko": {
"tokenizer": "pko-t5-large",
"organization": "PAUST",
"vocab_size": 50358,
"_n_bytes": 1524839,
"_n_tokens": 461643,
"_n_chars": 655190,
"_n_oov_chars": 1311,
"oov_ratio": 0.0020009462903890474,
"_oov_charset": "[\"²\", \"ⓒ\", \"⑨\", \"ㄴ\", \"ㅒ\", \"㎍\", \"良\", \"⑹\", \"流\", \"ㆍ\", \"㉠\", \"ㅞ\", \"ㅊ\", \"|\", \"ㅈ\", \"ㅚ\", \"累\", \"ㅠ\", \"ㄷ\", \"ⅲ\", \"龍\", \":\", \"ㅇ\", \"…\", \"③\", \"%\", \"?\", \"Ⅴ\", \"ㅎ\", \"樂\", \"ㅐ\", \"立\", \"⑴\", \"陸\", \"․\", \"ㅔ\", \"ⅱ\", \"ⓔ\", \"‥\", \"識\", \"㎞\", \"Ⅵ\", \"⑦\", \"ㅋ\", \"金\", \"ㄱ\", \"ㅗ\", \"ㅙ\", \"①\", \"ㅣ\", \"ⅳ\", \"梁\", \"⑵\", \"⑥\", \"樂\", \"Ⅷ\", \"Ⅸ\", \"ㅅ\", \"ㅍ\", \"ㅓ\", \"女\", \"ㅟ\", \"不\", \"㉰\", \"¹\", \"ㅡ\", \"⑤\", \"㎥\", \"Ⅳ\", \"ㅏ\", \"②\", \"Ⅹ\", \"⑸\", \"ㅛ\", \"「\", \"ㅕ\", \"Ⅲ\", \"ㅆ\", \"ㅘ\", \"理\", \" \", \"靈\", \"ㄹ\", \"Ⅶ\", \"ⅰ\", \"」\", \"Ⅰ\", \"Ⅱ\", \"⑧\", \"@\", \"*\", \"v\", \"℃\", \"⁴\", \"s\", \"㏊\", \"ㅁ\", \"㉣\", \"ㅑ\", \"㈜\", \"④\", \"ㅜ\", \"㎡\", \"ㅢ\", \"ㅖ\", \"ㅝ\", \"⑶\"]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/ar": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2813283,
"_n_tokens": 1421847,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/de": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1814876,
"_n_tokens": 619822,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/en": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1124813,
"_n_tokens": 269347,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/es": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1664455,
"_n_tokens": 546501,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/fa": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2054052,
"_n_tokens": 1145051,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/fr": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1540504,
"_n_tokens": 495052,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/ja": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1774770,
"_n_tokens": 581380,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/ko": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 1524839,
"_n_tokens": 652160,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"thu-coai/CharacterGLM-6B @ cc100/zh-Hans": {
"tokenizer": "CharacterGLM-6B",
"organization": "Tsinghua",
"vocab_size": 64789,
"_n_bytes": 2633047,
"_n_tokens": 563646,
"_n_chars": 927311,
"_n_oov_chars": 13,
"oov_ratio": 1.4019029214578496e-05,
"_oov_charset": "[\" \"]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/ar": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2813283,
"_n_tokens": 1597443,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/de": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1814876,
"_n_tokens": 497054,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/en": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1124813,
"_n_tokens": 262509,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/es": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1664455,
"_n_tokens": 442138,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/fa": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2054052,
"_n_tokens": 1246580,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/fr": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1540504,
"_n_tokens": 407853,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/ja": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1774770,
"_n_tokens": 842458,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/ko": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1524839,
"_n_tokens": 1330568,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-180b @ cc100/zh-Hans": {
"tokenizer": "falcon-180b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2633047,
"_n_tokens": 1124681,
"_n_chars": 927311,
"_n_oov_chars": 2313,
"oov_ratio": 0.0024943088133323123,
"_oov_charset": "[\"\\u0005\", \" \"]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/ar": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2813283,
"_n_tokens": 1597443,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/de": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1814876,
"_n_tokens": 497054,
"_n_chars": 1784021,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/en": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1124813,
"_n_tokens": 262509,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/es": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1664455,
"_n_tokens": 442138,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/fa": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2054052,
"_n_tokens": 1246580,
"_n_chars": 1145876,
"_n_oov_chars": 1,
"oov_ratio": 8.726947767472222e-07,
"_oov_charset": "[\" \"]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/fr": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1540504,
"_n_tokens": 407853,
"_n_chars": 1484970,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/ja": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1774770,
"_n_tokens": 842458,
"_n_chars": 603065,
"_n_oov_chars": 2,
"oov_ratio": 3.3163920970376326e-06,
"_oov_charset": "[\" \"]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/ko": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 1524839,
"_n_tokens": 1330568,
"_n_chars": 655190,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"tiiuae/falcon-7b @ cc100/zh-Hans": {
"tokenizer": "falcon-7b",
"organization": "TII",
"vocab_size": 65024,
"_n_bytes": 2633047,
"_n_tokens": 1124681,
"_n_chars": 927311,
"_n_oov_chars": 2313,
"oov_ratio": 0.0024943088133323123,
"_oov_charset": "[\"\\u0005\", \" \"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ar": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2813283,
"_n_tokens": 313168,
"_n_chars": 1560987,
"_n_oov_chars": 1140153,
"oov_ratio": 0.7304051859496588,
"_oov_charset": "[\"½\", \"\", \"ً\", \".\", \"ۗ\", \"█\", \"ظ\", \"ح\", \"ۤ\", \"ل\", \"‘\", \"«\", \"μ\", \"↩\", \"•\", \"ک\", \"®\", \"ی\", \"ج\", \"ة\", \"ب\", \"ع\", \"ذ\", \"″\", \"٠\", \")\", \"﴾\", \"د\", \"ض\", \"۸\", \"\", \"ُ\", \"▫\", \"ز\", \"٤\", \"٥\", \"ق\", \"٪\", \"…\", \"و\", \"ي\", \"χ\", \"ﻹ\", \"ٱ\", \"أ\", \"آ\", \"خ\", \"😊\", \"α\", \"ή\", \"-\", \"😀\", \"�\", \"۰\", \"\", \"٣\", \"!\", \"َ\", \"⤴\", \"٩\", \"ٹ\", \"ۖ\", \"س\", \"ۚ\", \"ْ\", \"ί\", \"\\\"\", \"ن\", \"🙂\", \"\", \"Х\", \"^\", \"،\", \"ك\", \"¡\", \"ﷺ\", \"ھ\", \"ء\", \"٦\", \"ر\", \"پ\", \"ؤ\", \"٢\", \"ا\", \"▪\", \"ِ\", \"‹\", \"←\", \"ﻻ\", \"\", \"٧\", \"♥\", \"م\", \"ف\", \"ّ\", \"]\", \"τ\", \"[\", \"ه\", \"چ\", \"â\", \"ث\", \"؟\", \"»\", \"غ\", \"ﻷ\", \"؛\", \" \", \"_\", \"۷\", \"ρ\", \"﴿\", \"إ\", \"©\", \"ت\", \"ـ\", \"η\", \"›\", \"
\", \"ش\", \"ٌ\", \"ٍ\", \"ى\", \"٨\", \"ص\", \"\", \",\", \"ٰ\", \"١\", \"ئ\", \"κ\", \"۲\", \"*\", \":\", \"(\", \"ط\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/de": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1814876,
"_n_tokens": 851962,
"_n_chars": 1784021,
"_n_oov_chars": 4556,
"oov_ratio": 0.002553781597862357,
"_oov_charset": "[\"²\", \"½\", \"\", \"j\", \".\", \"/\", \"‘\", \"«\", \"ö\", \"v\", \"N\", \"y\", \"↩\", \"m\", \"œ\", \"•\", \"😈\", \"H\", \"û\", \"s\", \"Ä\", \"¬\", \"🙁\", \"ι\", \"☺\", \")\", \";\", \"Ã\", \" \", \"I\", \"E\", \"M\", \"h\", \"G\", \"K\", \"…\", \"`\", \"B\", \"ε\", \"u\", \"S\", \"Á\", \"α\", \"b\", \"-\", \"ï\", \"k\", \"😀\", \"�\", \"♡\", \"§\", \"İ\", \"Ö\", \"á\", \"ė\", \"R\", \"£\", \"¿\", \"å\", \"≠\", \"♦\", \"ί\", \"\", \"🙂\", \"\", \"ß\", \"i\", \"̈\", \"t\", \"n\", \"c\", \"^\", \"Ü\", \"T\", \"e\", \"„\", \"😃\", \"a\", \"\", \"C\", \"¹\", \"↑\", \"😦\", \"r\", \"😉\", \"´\", \"à\", \"‹\", \"ü\", \"\", \"♥\", \"‽\", \"¶\", \"F\", \"❤\", \"τ\", \"ớ\", \"o\", \"Ø\", \"[\", \"🙄\", \"â\", \"D\", \"p\", \"»\", \"😢\", \"l\", \"\", \"z\", \"g\", \"L\", \"ς\", \"_\", \"ρ\", \"¤\", \"©\", \"ä\", \"¼\", \"d\", \"›\", \"\", \"f\", \"U\", \"q\", \"™\", \"Ÿ\", \"?\", \",\", \"J\", \"ń\", \"😆\", \"➔\", \"€\", \"*\", \"‚\", \"V\", \"A\", \"😂\", \"▼\", \"(\", \"ư\", \"w\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/en": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1124813,
"_n_tokens": 463681,
"_n_chars": 1121360,
"_n_oov_chars": 222,
"oov_ratio": 0.00019797388884925448,
"_oov_charset": "[\"③\", \"\", \"⑧\", \"»\", \"🙂\", \"⑩\", \"\", \"_\", \"‘\", \"«\", \"\", \"^\", \"•\", \"¡\", \"ï\", \"😥\", \"¦\", \"®\", \"�\", \"\", \"⑤\", \"‑\", \"😉\", \"´\", \"£\", \"⑦\", \"\", \"…\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/es": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1664455,
"_n_tokens": 779440,
"_n_chars": 1630297,
"_n_oov_chars": 4110,
"oov_ratio": 0.002521013042408837,
"_oov_charset": "[\"²\", \"ª\", \"✪\", \"Ó\", \"Í\", \".\", \"ú\", \"/\", \"‘\", \"O\", \"«\", \"ö\", \"N\", \"m\", \"•\", \"®\", \"Ú\", \"H\", \"s\", \"🙁\", \"″\", \")\", \";\", \"✓\", \"I\", \"E\", \"M\", \"G\", \"K\", \"…\", \"—\", \"B\", \"S\", \"x\", \"Á\", \"b\", \"º\", \"-\", \"😀\", \"k\", \"\", \"á\", \"ý\", \"R\", \"―\", \"¿\", \"ò\", \"✔\", \"▷\", \"👍\", \"️\", \"🙂\", \"\", \"✖\", \"X\", \"i\", \"Q\", \"\", \"t\", \"n\", \"c\", \"^\", \"T\", \"¡\", \"C\", \"Z\", \"😦\", \"r\", \"😉\", \"´\", \"←\", \"é\", \"F\", \"❤\", \"o\", \"М\", \"[\", \"D\", \"»\", \"p\", \"l\", \"\", \"g\", \"í\", \"L\", \"_\", \"Ñ\", \"©\", \"'\", \"d\", \"f\", \"U\", \"ó\", \",\", \"?\", \"J\", \"€\", \"A\", \"V\", \"P\", \"(\", \"\", \"👏\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/fa": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2054052,
"_n_tokens": 268077,
"_n_chars": 1145876,
"_n_oov_chars": 891183,
"oov_ratio": 0.7777307492259198,
"_oov_charset": "[\"✿\", \"\", \"ً\", \".\", \"◄\", \"ظ\", \"ح\", \"★\", \"ل\", \"‘\", \"«\", \"+\", \"ﮧ\", \"•\", \"ک\", \"ּ\", \"ی\", \"ج\", \"ة\", \"ب\", \"ع\", \"ذ\", \")\", \"٠\", \"د\", \"ض\", \"۸\", \"۱\", \"ُ\", \"ز\", \"٤\", \"٥\", \"ٴ\", \"ق\", \"گ\", \"٪\", \"…\", \"ي\", \"و\", \"أ\", \"آ\", \"خ\", \"ژ\", \"�\", \"۰\", \"\", \"۵\", \"٣\", \"!\", \"َ\", \"ٔ\", \"٩\", \"س\", \"ْ\", \"️\", \"ن\", \"\", \"ڪ\", \"\", \"\", \"،\", \"٫\", \"ك\", \"۶\", \"ט\", \"ھ\", \"ء\", \"ر\", \"پ\", \"ؤ\", \"ۀ\", \"٢\", \"ا\", \"ِ\", \"\", \"٧\", \"♥\", \"م\", \"ف\", \"ّ\", \"]\", \"❤\", \"”\", \"[\", \"ه\", \"چ\", \"ث\", \"؟\", \"»\", \"غ\", \"ے\", \"؛\", \" \", \"۔\", \"۷\", \"۹\", \"۳\", \"إ\", \"©\", \"ت\", \"ـ\", \"ב\", \"›\", \"▐\", \"ش\", \"ۆ\", \"ٌ\", \"ٍ\", \"ى\", \"٨\", \"ص\", \"\", \"١\", \"ئ\", \"۲\", \":\", \"(\", \"۴\", \"ط\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/fr": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1540504,
"_n_tokens": 695164,
"_n_chars": 1484970,
"_n_oov_chars": 12806,
"oov_ratio": 0.008623743240604187,
"_oov_charset": "[\"²\", \".\", \"ë\", \"🤔\", \"/\", \"ç\", \"‘\", \"«\", \"O\", \"♠\", \"v\", \"N\", \"y\", \"m\", \"œ\", \"•\", \"è\", \"®\", \"H\", \"û\", \"s\", \"″\", \")\", \"Ç\", \"I\", \"E\", \"M\", \"G\", \"h\", \"…\", \"î\", \"B\", \"u\", \"S\", \"x\", \"♕\", \"
\", \"À\", \"Ê\", \"b\", \"̧\", \"ï\", \"😀\", \"�\", \"§\", \"\", \"É\", \"R\", \"È\", \"ù\", \"🙂\", \"\", \"i\", \"Q\", \"t\", \"n\", \"c\", \"µ\", \"^\", \"T\", \"ê\", \"a\", \"C\", \"r\", \"à\", \"´\", \"😉\", \"←\", \"̂\", \"é\", \"F\", \"❤\", \"o\", \"â\", \"D\", \"p\", \"»\", \"ã\", \"l\", \"z\", \"g\", \"L\", \"℃\", \"_\", \"Ô\", \"ô\", \"ğ\", \"'\", \"d\", \"f\", \"q\", \"™\", \",\", \"?\", \"Î\", \"́\", \"€\", \"A\", \"P\", \"Â\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ja": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1774770,
"_n_tokens": 384900,
"_n_chars": 603065,
"_n_oov_chars": 8217,
"oov_ratio": 0.013625396930679113,
"_oov_charset": "[\"T\", \"捩\", \"\", \"¥\", \"Q\", \"滓\", \"彡\", \"1\", \"液\", \"瓢\", \"◆\", \"験\", \"貪\", \"〝\", \"V\", \"k\", \"柄\", \"゚\", \"好\", \"Д\", \"テ\", \"□\", \"埃\", \"呆\", \"`\", \"◇\", \"%\", \"囁\", \"憂\", \"?\", \"舐\", \"鋲\", \"拙\", \"-\", \"着\", \"は\", \"聾\", \"ω\", \"金\", \"捲\", \"9\", \"ロ\", \"意\", \"忽\", \"匙\", \"む\", \"佇\", \"ハ\", \"▷\", \"腸\", \"ト\", \"然\", \"趨\", \"傲\", \"目\", \"😌\", \"弄\", \"^\", \"簗\", \"$\", \"快\", \"逡\", \"呟\", \"\\", \"0\", \"②\", \"贔\", \"嚥\", \"B\", \"斂\", \"「\", \"E\", \"凪\", \"❤\", \"磨\", \"♪\", \"ヽ\", \"僭\", \"へ\", \"た\", \"徊\", \"⑧\", \"羞\", \"生\", \"℃\", \"出\", \"愉\", \"悶\", \"ス\", \"リ\", \"h\", \"り\", \"[\", \"〆\", \"托\", \"ヨ\", \"ぶ\", \"澪\", \"磋\", \"恥\", \"熱\", \"n\", \"ホ\", \"慄\", \"義\", \"諺\", \"I\", \".\", \"\", \"«\", \"叭\", \"野\", \"ぉ\", \"゙\", \"─\", \"か\", \"/\", \"L\", \"メ\", \"m\", \"真\", \"艸\", \"瘻\", \"槃\", \"烹\", \"و\", \"眩\", \"直\", \"摯\", \"罵\", \"ゝ\", \"⌒\", \"y\", \"彌\", \"=\", \"衿\", \"😭\", \"俄\", \"(\", \"め\", \"お\", \"o\", \"貶\", \"峠\", \"a\", \"~\", \"梳\", \"F\", \"W\", \"逼\", \"碍\", \"帰\", \"⑪\", \"フ\", \"崎\", \"ゥ\", \"︎\", \"Ⅹ\", \"痒\", \"屹\", \"´\", \"咳\", \"瀬\", \"飴\", \"鱈\", \"欝\", \"ふ\", \"下\", \"』\", \"箭\", \"◎\", \"臆\", \"s\", \"i\", \"浣\", \"丿\", \"韮\", \"精\", \"🌙\", \"淹\", \"ヾ\", \"J\", \"覧\", \"\\b\", \"④\", \"^\", \"5\", \"◡\", \"割\", \"?\", \"頷\", \"え\", \"吠\", \"滲\", \"▼\", \"杞\", \"欲\", \"(\", \"d\", \"レ\", \"唆\", \"唸\", \"画\", \"/\", \"ゎ\", \"カ\", \"。\", \"杼\", \"®\", \"杓\", \"せ\", \".\", \"ぅ\", \"細\", \"|\", \"¥\", \";\", \";\", \"巾\", \"怪\", \"蠍\", \"莽\", \"S\", \"…\", \"ノ\", \"収\", \"③\", \"\\u001b\", \"く\", \"障\", \"⇒\", \"迫\", \"い\", \"色\", \"截\", \"淫\", \"惑\", \"♡\", \"媚\", \"入\", \"奢\", \"拭\", \"彷\", \"越\", \"靄\", \"さ\", \"心\", \"コ\", \"痴\", \"誹\", \"∇\", \"゚\", \"①\", \"馴\", \"切\", \"l\", \"<\", \"餃\", \"徘\", \"_\", \"咽\", \"̈\", \" ̄\", \"し\", \"゙\", \"草\", \"↓\", \"A\", \"G\", \"姑\", \"P\", \"唾\", \"喇\", \"纒\", \"鞄\", \"〟\", \"↑\", \"筈\", \"▽\", \"ィ\", \"D\", \"←\", \"る\", \"M\", \"‼\", \"詈\", \" \", \"・\", \"捐\", \"ア\", \"̀\", \"Ⅱ\", \"*\", \"😢\", \"立\", \"X\", \"\", \"_\", \"氷\", \"ウ\", \"す\", \"ひ\", \"押\", \"Y\", \"ハ\", \"合\", \"`\", \"碌\", \"3\", \"灼\", \"慢\", \"r\", \"シ\", \"́\", \"R\", \"謄\", \"&\", \"碓\", \"て\", \"∀\", \"謗\", \"7\", \"巡\", \"⑩\", \"b\", \"茫\", \"嘗\", \"巷\", \"烙\", \"不\", \"•\", \"腑\", \"H\", \"N\", \"噤\", \"ー\", \"]\", \"◯\", \"g\", \"6\", \"💦\", \"Z\", \"き\", \"″\", \")\", \"攫\", \"些\", \"鉢\", \"羨\", \"✨\", \"ど\", \"U\", \"4\", \"啜\", \"徨\", \"๑\", \",\", \":\", \"フ\", \"病\", \"焙\", \"弓\", \"千\", \"み\", \"!\", \"♫\", \"○\", \"び\", \"嗚\", \"😊\", \"愕\", \"ん\", \"姥\", \"�\", \"子\", \"掬\", \"ㅂ\", \"悍\", \"2\", \"膏\", \">\", \"‥\", \"残\", \"㎞\", \"垠\", \"-\", \"O\", \"恰\", \"れ\", \"ヒ\", \"w\", \"ゞ\", \"コ\", \"つ\", \"e\", \"膿\", \"⇔\", \"恣\", \"+\", \"ま\", \"C\", \"t\", \"⻑\", \"遜\", \"涅\", \"Ⅶ\", \"」\", \"@\", \"»\", \"と\", \")\", \"東\", \"琢\", \"わ\", \"捺\", \"闊\", \"っ\", \"©\", \"✧\", \"、\", \"8\", \"訝\", \"ヘ\", \"取\", \"躾\", \"闖\", \"K\", \"屓\", \"歩\", \"f\", \"嵌\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/ko": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 1524839,
"_n_tokens": 207392,
"_n_chars": 655190,
"_n_oov_chars": 466530,
"oov_ratio": 0.7120529922617866,
"_oov_charset": "[\"칸\", \"었\", \"끄\", \"峴\", \"贖\", \"긴\", \"얘\", \"취\", \"흐\", \"ㆍ\", \"갉\", \"팜\", \"맘\", \"낭\", \"땀\", \"龍\", \"슷\", \"햄\", \"굽\", \"잎\", \"ㅇ\", \"쏙\", \"꺽\", \"□\", \"활\", \"좌\", \"부\", \"멤\", \"겔\", \"갯\", \"쿵\", \"달\", \"코\", \"름\", \"둬\", \"💸\", \"총\", \"젠\", \"웹\", \"떡\", \"전\", \"헛\", \"뛸\", \"룸\", \"緞\", \"찮\", \"픔\", \"베\", \"왁\", \"켓\", \"줍\", \"坐\", \"본\", \"갭\", \"멍\", \"찬\", \"燦\", \"압\", \"팔\", \"험\", \"랄\", \"썅\", \"랫\", \"ㅟ\", \"억\", \"뽀\", \"흥\", \"잦\", \"ㅏ\", \"침\", \"릉\", \"눈\", \"펴\", \"밋\", \"즙\", \"밥\", \"며\", \"안\", \"▣\", \"❤\", \"킴\", \"섭\", \"찜\", \"찼\", \"희\", \"싶\", \"폰\", \"슴\", \"🍕\", \"쌈\", \"격\", \"面\", \"럽\", \"축\", \"뺀\", \"명\", \"윌\", \"💕\", \"북\", \"효\", \"펄\", \"처\", \"뿔\", \"쯔\", \"섞\", \"겐\", \"띕\", \"에\", \"룬\", \"등\", \"제\", \"章\", \"뎅\", \"짢\", \"약\", \"👨\", \"것\", \"껑\", \"팍\", \"빔\", \"쿠\", \"념\", \"캘\", \"∙\", \"뮈\", \"맞\", \"둘\", \"딜\", \"릴\", \"큰\", \"긍\", \"챙\", \"탱\", \"낀\", \"㉿\", \"단\", \"즈\", \"랍\", \"맨\", \"솔\", \"느\", \"머\", \"암\", \"휘\", \"떻\", \"연\", \"납\", \"허\", \"꾀\", \"도\", \"커\", \"천\", \"跏\", \"ⓔ\", \"낱\", \"天\", \"쨍\", \"졌\", \"뼘\", \"數\", \"뜰\", \"홍\", \"듯\", \"뿌\", \"렐\", \"월\", \"불\", \"댔\", \"곁\", \"깃\", \"솥\", \"장\", \"갖\", \"♤\", \"금\", \"씨\", \"꽁\", \"\", \"녘\", \"범\", \"쟈\", \"회\", \"찰\", \"㉰\", \"너\", \"옌\", \"相\", \"색\", \"꺼\", \"秋\", \"흄\", \"\", \"겸\", \"渴\", \"世\", \"뚫\", \"꿇\", \"닿\", \"ᴇ\", \"雲\", \"닦\", \"혜\", \"췌\", \"판\", \"淨\", \"🏷\", \"램\", \"좇\", \"넌\", \"참\", \"고\", \"짬\", \"았\", \"벨\", \"?\", \"땡\", \"멋\", \"형\", \"멀\", \"빌\", \"없\", \"칫\", \"춥\", \"튜\", \"➊\", \"다\", \"⑨\", \"臺\", \"폿\", \"®\", \"써\", \"원\", \"책\", \"팥\", \"르\", \"폼\", \"궁\", \"신\", \"객\", \"壞\", \"륜\", \"깨\", \"≫\", \"탐\", \"당\", \"울\", \"蟄\", \"볕\", \"툭\", \"샬\", \"위\", \"풋\", \"흡\", \"띄\", \"룡\", \"잇\", \"할\", \"툰\", \"멸\", \"잣\", \"큽\", \"밍\", \"셈\", \"勢\", \"롤\", \"쥰\", \"담\", \"⑵\", \"답\", \"빅\", \"젝\", \"빼\", \"ㅍ\", \"껍\", \"퇴\", \"션\", \"솨\", \"깜\", \"율\", \"겪\", \"그\", \"듬\", \"샤\", \"륭\", \"절\", \"씻\", \"←\", \"🗺\", \"렴\", \"컷\", \"막\", \"◐\", \"文\", \"헝\", \"돕\", \"않\", \"탑\", \"‧\", \"눴\", \"擒\", \"듭\", \"떤\", \"#\", \"풍\", \"멘\", \"빴\", \"ㅑ\", \"펜\", \"괄\", \"엉\", \"딴\", \"셰\", \"민\", \"플\", \"촬\", \"價\", \"덜\", \"뱀\", \"놔\", \"옥\", \"ㅖ\", \"닝\", \"쿨\", \"水\", \"거\", \"훔\", \"지\", \"톨\", \"테\", \"述\", \"ㄴ\", \"훌\", \"핍\", \"윗\", \"점\", \"댈\", \"률\", \"논\", \"•\", \"🍞\", \"쯤\", \"빚\", \"쉼\", \"斗\", \"禮\", \"냐\", \"합\", \"아\", \"💦\", \"골\", \"뜨\", \"둥\", \"黃\", \"한\", \"끙\", \"즘\", \"띤\", \"➎\", \"젖\", \"묶\", \"臀\", \"온\", \"근\", \"찾\", \"얍\", \"오\", \"사\", \"되\", \"Ⅴ\", \"꿍\", \"륙\", \"立\", \"삣\", \"ᴍ\", \"응\", \"티\", \"왔\", \"짠\", \"🍔\", \"혐\", \"‥\", \"굶\", \"습\", \"🍭\", \"係\", \"❏\", \"낯\", \"려\", \"삭\", \"밀\", \"물\", \"떠\", \"걍\", \"Ⅸ\", \"닫\", \"理\", \"엌\", \"떼\", \"상\", \"눅\", \"꽉\", \"퀘\", \"펠\", \"보\", \"받\", \"웬\", \"밧\", \"¹\", \"Ⅳ\", \"킁\", \"둔\", \"초\", \"뭉\", \"光\", \"悧\", \"💌\", \"왕\", \"겟\", \"♥\", \"께\", \"첫\", \"훑\", \"ㄹ\", \"왼\", \"링\", \"펼\", \"💡\", \"」\", \"넷\", \"챨\", \"썰\", \"학\", \"씀\", \"멈\", \"♣\", \"렇\", \"©\", \"짝\", \"參\", \"녕\", \"쪽\", \"뭔\", \"죤\", \"떨\", \"있\", \"궐\", \"렜\", \"쌉\", \"짚\", \"🌳\", \"몰\", \"듈\", \"☎\", \"쏠\", \"츠\", \"붙\", \"쟁\", \"갱\", \"낫\", \"요\", \"훼\", \"췄\", \"韜\", \"릭\", \"꿀\", \"죄\", \"🤟\", \"歲\", \"ㅚ\", \"ⅲ\", \"칠\", \"잼\", \"흙\", \"꺄\", \"엑\", \"킌\", \"덧\", \"욜\", \"잉\", \"`\", \"◇\", \"죠\", \"긋\", \"챔\", \"벽\", \"헉\", \"재\", \"쎈\", \"양\", \"푼\", \"웠\", \"➏\", \"-\", \"워\", \"펌\", \"체\", \"k\", \"⑴\", \"ω\", \"닥\", \"누\", \"뤘\", \"툼\", \"⬇\", \"팰\", \"옵\", \"낼\", \"쓸\", \"▷\", \"ㅗ\", \"듐\", \"ⅳ\", \"디\", \"감\", \"늘\", \"將\", \"러\", \"계\", \"솜\", \"될\", \"뛴\", \"슝\", \"콕\", \"🙆\", \"캄\", \"봇\", \"뻑\", \"뀐\", \"롭\", \"쌩\", \"「\", \"과\", \"琪\", \"딥\", \"ㅘ\", \"퉁\", \"賣\", \"횟\", \"든\", \"굵\", \"⑧\", \"💰\", \"벅\", \"똘\", \"액\", \"℃\", \"넵\", \"읍\", \"쉘\", \"峙\", \"셜\", \"카\", \"靑\", \"끗\", \"듀\", \"능\", \"퀀\", \"마\", \"쟤\", \"ɪ\", \"誡\", \"깥\", \"릿\", \"끼\", \"槪\", \"놓\", \"꿨\", \".\", \"얕\", \"삿\", \"샌\", \"ㅒ\", \"석\", \"국\", \"턴\", \"엣\", \"겨\", \"역\", \"卽\", \"藥\", \"탈\", \"끊\", \"펀\", \"經\", \"겠\", \"만\", \"렛\", \"드\", \"섣\", \"콩\", \"캉\", \"칭\", \"뺏\", \"탁\", \"앞\", \"땐\", \"꾸\", \"쉰\", \"빠\", \"숙\", \"섰\", \"뼈\", \"핵\", \"괌\", \"슨\", \"댐\", \"씬\", \"曆\", \"첩\", \"어\", \"했\", \"냥\", \"건\", \"걷\", \"크\", \"창\", \"좁\", \"룩\", \"승\", \"런\", \"뮌\", \"세\", \"촌\", \"뜩\", \"곰\", \"호\", \"음\", \"깅\", \"식\", \"샴\", \"뭐\", \"펩\", \"딩\", \"팠\", \"쒀\", \"영\", \"뚜\", \"벳\", \"친\", \"랜\", \"빗\", \"셔\", \"Ⅹ\", \"둑\", \"︎\", \"奉\", \"항\", \"휠\", \"쫄\", \"인\", \"품\", \"갇\", \"쨌\", \"녁\", \"쁘\", \"롱\", \"뮬\", \"뻐\", \"꿰\", \"◦\", \"팁\", \"몬\", \"ᴡ\", \"◎\", \"템\", \"틸\", \"⁴\", \"져\", \"덟\", \"랙\", \"뿜\", \"익\", \"류\", \"증\", \"잰\", \"켐\", \"횡\", \"얽\", \"렀\", \"꽝\", \"쏭\", \"방\", \"갚\", \"(\", \"吳\", \"넹\", \"榜\", \"털\", \"복\", \"텨\", \"욱\", \"기\", \"봅\", \"향\", \"칩\", \"견\", \"락\", \"콥\", \"옳\", \"엇\", \"림\", \"핀\", \"ㅈ\", \"녹\", \"소\", \"널\", \"벵\", \"쾅\", \"制\", \"귀\", \"십\", \"🌿\", \"😣\", \"떳\", \"…\", \"윤\", \"났\", \"졸\", \"⇒\", \"툴\", \"🤕\", \"잤\", \"렸\", \"넨\", \"셨\", \"뜻\", \"🏫\", \"묻\", \"🦅\", \"濟\", \"두\", \"ⅱ\", \"🚨\", \"!\", \"귤\", \"끈\", \"악\", \"집\", \"뜸\", \"쪄\", \"숫\", \"金\", \"선\", \"줄\", \"헐\", \"①\", \"☀\", \"클\", \"뫼\", \"튼\", \"꿈\", \"컵\", \"궜\", \"덴\", \"↓\", \"묵\", \"을\", \"키\", \"줘\", \"뭇\", \"표\", \"킨\", \"戮\", \"🦄\", \"홉\", \"돌\", \"젤\", \"잊\", \"꾼\", \"씽\", \"귈\", \"숨\", \"뢰\", \"존\", \"쳐\", \"넬\", \"륨\", \"쑤\", \"태\", \"康\", \"욕\", \"럿\", \"닷\", \"發\", \"델\", \"밉\", \"로\", \"쉬\", \"톡\", \"헬\", \"셉\", \"🍰\", \"갤\", \"캠\", \"앓\", \"후\", \"확\", \"ㅜ\", \"뺐\", \"봤\", \"결\", \"른\", \"녀\", \"🌵\", \"枯\", \"히\", \"해\", \"구\", \"무\", \"켄\", \"략\", \"힉\", \"낡\", \"춰\", \"뇌\", \"맡\", \"퀸\", \"균\", \"타\", \"완\", \"곤\", \"侯\", \"飮\", \"때\", \"데\", \"팬\", \")\", \"둡\", \"냈\", \"교\", \"觸\", \"찔\", \"콜\", \"대\", \"덤\", \"임\", \"텅\", \"옮\", \"최\", \"쫀\", \"∼\", \"가\", \"樂\", \"�\", \"눠\", \"․\", \"§\", \"튀\", \"출\", \"즉\", \"군\", \"님\", \"~\", \"끝\", \"딤\", \"문\", \"쪼\", \"£\", \"⑦\", \"봄\", \"곽\", \"쥐\", \"착\", \"ㅣ\", \"섹\", \"맛\", \"컨\", \"뗀\", \"숯\", \"홀\", \"벚\", \"릇\", \"녔\", \"깔\", \"흑\", \"햇\", \"왠\", \"쌓\", \"먼\", \"돗\", \"앵\", \"德\", \"짜\", \"네\", \"폍\", \"올\", \"얻\", \"헨\", \"혼\", \"걀\", \" \", \"엄\", \"록\", \"걸\", \"쫓\", \"샵\", \"내\", \"팩\", \"륵\", \"갈\", \"굿\", \"➍\", \"€\", \"㎡\", \"⑶\", \"텁\", \"쓰\", \"\", \"턱\", \"ᴛ\", \"준\", \"쩌\", \"蚩\", \"ᴏ\", \"닙\", \"劍\", \"유\", \"흘\", \"ㅞ\", \"◆\", \"엠\", \"關\", \"綃\", \"짭\", \"튠\", \"움\", \"앉\", \"엿\", \"ᴀ\", \"흔\", \"앗\", \"척\", \"괴\", \"쓴\", \"눔\", \"우\", \"둠\", \"멜\", \"첨\", \"씌\", \"〮\", \"탓\", \"까\", \"서\", \"켤\", \"👋\", \"Ⅵ\", \"줏\", \"현\", \"뱅\", \"시\", \"밖\", \"웁\", \"️\", \"◼\", \"弛\", \"뀔\", \"쐐\", \"됨\", \"ㅅ\", \"게\", \"낮\", \"댄\", \"푹\", \"✈\", \"먹\", \"🤭\", \"②\", \"뿍\", \"뱉\", \"쁜\", \"➌\", \"경\", \"ㅕ\", \"쉴\", \"理\", \"섯\", \"츈\", \"뮤\", \"璿\", \"넥\", \"야\", \"뽐\", \"입\", \"꿕\", \"및\", \"터\", \"퍽\", \"운\", \"픽\", \"팹\", \"㈜\", \"짙\", \"팝\", \"쿰\", \"童\", \"食\", \"캡\", \"🙋\", \"💣\", \"榮\", \"팟\", \"혔\", \"쏘\", \"싯\", \"광\", \"들\", \"용\", \"잔\", \"뉘\", \"김\", \"듣\", \"룰\", \"뤄\", \"랑\", \"줌\", \"닛\", \"꼈\", \"람\", \"껏\", \"숏\", \"새\", \"잖\", \"난\", \"쁠\", \"엔\", \"관\", \"㎍\", \"良\", \"일\", \"뻤\", \"립\", \"첸\", \"벗\", \"璣\", \"쭉\", \"맹\", \"흰\", \"ㄷ\", \"앙\", \"하\", \"긁\", \"⚀\", \"함\", \"봬\", \"징\", \"삽\", \"칙\", \"덕\", \"웍\", \"렉\", \"킬\", \"몫\", \"펙\", \"으\", \"래\", \"뛰\", \"값\", \"늬\", \"쭙\", \"딱\", \"엽\", \"따\", \"😭\", \"띠\", \"燭\", \"◾\", \"뜹\", \"깊\", \"넘\", \"탠\", \"쫒\", \"씹\", \"동\", \"촛\", \"\", \"尤\", \"촉\", \"꼽\", \"찌\", \"흩\", \"女\", \"💅\", \"셸\", \"돔\", \"뇨\", \"냉\", \"궤\", \"뒀\", \"똥\", \"텍\", \"옐\", \"켈\", \"톰\", \"㎥\", \"럼\", \"넣\", \"部\", \"겼\", \"돠\", \"쿼\", \"숍\", \"폈\", \"굉\", \"덮\", \"닉\", \"샐\", \"훗\", \"핫\", \"렷\", \"뿐\", \"俠\", \"맑\", \"깁\", \"픕\", \"짐\", \"훈\", \"㏊\", \"프\", \"톱\", \"껀\", \"④\", \"흗\", \"뭘\", \"🤗\", \"겹\", \"번\", \"탕\", \"킹\", \"ㅝ\", \"▶\", \"▼\", \"힙\", \"브\", \"└\", \"핥\", \"층\", \"니\", \"땠\", \"열\", \"‘\", \"읊\", \"를\", \"바\", \"늄\", \"나\", \"자\", \"얏\", \"땅\", \"핸\", \"심\", \"반\", \"폄\", \";\", \"찢\", \"뒤\", \"↕\", \"롬\", \"던\", \"닮\", \"쿄\", \"\", \"트\", \"미\", \"빳\", \"趺\", \"③\", \"밤\", \"뎀\", \"좆\", \"녜\", \"은\", \"팀\", \"♡\", \"걔\", \"벼\", \"와\", \"끔\", \"낍\", \"識\", \"벤\", \"쩔\", \"백\", \"예\", \"왜\", \"ㅙ\", \"밴\", \"셋\", \"⑥\", \"힌\", \"Ⅷ\", \"묘\", \"샘\", \"년\", \"박\", \"질\", \"쩐\", \"說\", \"틋\", \"↑\", \"딪\", \"ㅛ\", \"글\", \"맥\", \"버\", \"載\", \"렬\", \"ʟ\", \"웰\", \"곧\", \" \", \"諒\", \"탭\", \"뀌\", \"ⅰ\", \"배\", \"Ⅰ\", \"쏜\", \"拜\", \"밭\", \"싫\", \"v\", \"셌\", \"悖\", \"슐\", \"≤\", \"노\", \"수\", \"밟\", \"엮\", \"쭈\", \"홑\", \"텔\", \"즌\", \"劫\", \"순\", \"족\", \"꼬\", \"량\", \"쌀\", \"냅\", \"끌\", \"밝\", \"밌\", \"붓\", \"P\", \"😂\", \"쎄\", \"별\", \"닭\", \"득\", \"雙\", \"퀄\", \"ⓒ\", \"높\", \"극\", \"왓\", \"됩\", \"촘\", \"갔\", \"흉\", \"짤\", \"팎\", \"행\", \"팽\", \"날\", \"필\", \"콰\", \"쫑\", \"썬\", \"읽\", \"뵙\", \"넓\", \"강\", \"급\", \"술\", \"얼\", \"꿔\", \"힜\", \"ㅠ\", \"통\", \"캣\", \"◈\", \"엡\", \"농\", \"간\", \"분\", \"낳\", \"%\", \"황\", \"꽂\", \"탄\", \"솟\", \"쇠\", \"ㅐ\", \"잴\", \"겉\", \"슬\", \"屠\", \"꽃\", \"쐬\", \"실\", \"뾱\", \"\", \"퀴\", \"큐\", \"므\", \"뚝\", \"닳\", \"똑\", \"맴\", \"푸\", \"人\", \"몹\", \"\", \"쌍\", \"패\", \"법\", \"흠\", \"쉽\", \"킥\", \"헤\", \"ㅡ\", \"뺑\", \"몸\", \"냠\", \"홈\", \"⑸\", \"웖\", \"면\", \"말\", \"찍\", \"츄\", \"맺\", \"퍙\", \"탬\", \"]\", \"體\", \"작\", \"뜯\", \"◀\", \"깽\", \"靈\", \"는\", \"Ⅶ\", \"청\", \"랬\", \"붐\", \"🍟\", \"틔\", \"눕\", \"對\", \"빈\", \"쳤\", \"좀\", \"진\", \"옆\", \"혁\", \"겁\", \"假\", \"믐\", \"칼\", \"쥬\", \"삐\", \"딸\", \"캔\", \"혀\", \"짓\", \"節\", \"붕\", \"피\", \"적\", \"譯\", \"👏\", \"걱\", \"맬\", \"볍\", \"훨\", \"왘\", \"같\", \"볼\", \"뉜\", \"차\", \"⑹\", \"저\", \"㉠\", \"ㅊ\", \"덥\", \"짊\", \"됐\", \"산\", \"잃\", \"싱\", \"검\", \"캐\", \"폐\", \"累\", \"춘\", \"❍\", \"짖\", \"랭\", \"렁\", \"페\", \"픈\", \"뷔\", \"獻\", \"%\", \"슈\", \"옛\", \"낚\", \"?\", \"死\", \"잡\", \"린\", \"ㅎ\", \"낸\", \"종\", \"옴\", \"앰\", \"살\", \"氣\", \"쾌\", \"뜬\", \"ㅔ\", \"삘\", \"쿡\", \"⋅\", \"훅\", \"갑\", \"옹\", \"정\", \"빡\", \"괜\", \"ㅋ\", \"ㄱ\", \"즐\", \"👍\", \"ᴄ\", \"윈\", \"쫗\", \"쇄\", \"넉\", \"앨\", \"빵\", \"추\", \"ㅓ\", \"^\", \"♧\", \"섦\", \"칵\", \"投\", \"텝\", \"🙌\", \"깐\", \"빨\", \"놈\", \"롸\", \"늙\", \"像\", \"뒷\", \"망\", \"킵\", \"샀\", \"ã\", \"공\", \"🏻\", \"힐\", \"또\", \"內\", \"닌\", \"ㅁ\", \"㉣\", \"론\", \"발\", \"늑\", \"빕\", \"굴\", \"됬\", \"싹\", \"접\", \"🥁\", \"핑\", \"🤔\", \"딛\", \"권\", \"⊙\", \"옷\", \"꺾\", \"맵\", \"슛\", \"텀\", \"설\", \"블\", \"💥\", \"쑥\", \"였\", \"못\", \"삶\", \"♀\", \"쏟\", \"🍎\", \"렘\", \"틴\", \"벙\", \"직\", \"럭\", \"협\", \"줬\", \"촨\", \"싸\", \"쇼\", \"컸\", \"陸\", \"댓\", \"🚿\", \"퀵\", \"끓\", \"씩\", \"충\", \"획\", \"모\", \"꼭\", \"✔\", \"土\", \"휴\", \"눌\", \"깡\", \"뻗\", \"톤\", \"욥\", \"樂\", \"퍼\", \"쾨\", \"껴\", \"쩍\", \"놀\", \"훠\", \"폴\", \"짱\", \"튿\", \"춤\", \"\", \"Z\", \"빤\", \"낌\", \"初\", \"랴\", \"↔\", \"켰\", \"∮\", \"딧\", \"뱃\", \"염\", \"스\", \"떄\", \"뤼\", \"케\", \"랐\", \"갓\", \"戌\", \"포\", \"변\", \"s\", \"남\", \"몽\", \"첼\", \"철\", \"섬\", \"굳\", \"랩\", \"혈\", \"윙\", \"목\", \"퓨\", \"펑\", \"힘\", \"얀\", \"릅\", \"ㅢ\", \"곡\", \"몇\", \"놨\", \"밸\", \"렵\", \"²\", \"언\", \"컬\", \"낙\", \"틱\", \"측\", \"벌\", \"流\", \"應\", \"뭥\", \"휩\", \"|\", \"력\", \"루\", \"센\", \"곱\", \"숟\", \"챌\", \"맷\", \"≪\", \"외\", \"업\", \"쓕\", \"썹\", \"길\", \"삼\", \"롯\", \"븐\", \"앤\", \"➋\", \"냄\", \"싼\", \"뉴\", \"딘\", \"좋\", \"獨\", \"토\", \"젊\", \"썩\", \"色\", \"쳇\", \"채\", \"컴\", \"튬\", \"혹\", \"變\", \"웃\", \"닐\", \"봐\", \"챗\", \"샷\", \"잘\", \"돋\", \"꽤\", \"례\", \"쿤\", \"웅\", \"앱\", \"켠\", \"🔹\", \"梁\", \"째\", \"곳\", \"럴\", \"파\", \"튄\", \"앎\", \"맙\", \"메\", \"숱\", \"비\", \"렌\", \"봉\", \"밑\", \"련\", \"켜\", \"이\", \"콘\", \"콤\", \"잭\", \"틀\", \"깝\", \"믹\", \"매\", \"웨\", \"얇\", \"敎\", \"싣\", \"Ⅲ\", \"ㅆ\", \"조\", \"얹\", \"멕\", \"뮐\", \"뷰\", \"손\", \"엘\", \"Ⅱ\", \"*\", \"평\", \"릎\", \"주\", \"鎭\", \"_\", \"잠\", \"떴\", \"궈\", \"썼\", \"꼴\", \"돼\", \"›\", \"짧\", \"편\", \"얄\", \"퓰\", \"룹\", \"😗\", \"뽑\", \"쬐\", \"죽\", \"속\", \"셀\", \"송\", \"여\", \"春\", \"큼\", \"애\", \"란\", \"투\", \"령\", \"치\", \"화\", \"軍\", \"특\", \"빙\", \"성\", \"레\", \"띈\", \"틈\", \"의\", \"\", \"덩\", \"믄\", \"료\", \"알\", \":\", \"😱\", \"핏\", \"넛\", \"◑\", \"탰\", \"댁\", \"😊\", \"팡\", \"독\", \"갛\", \"홋\", \"텐\", \"숲\", \"☞\", \"된\", \"빛\", \"㎞\", \"낄\", \"붉\", \"略\", \"캇\", \"젓\", \"썸\", \"▒\", \"쩡\", \"늦\", \"샹\", \"不\", \"믿\", \"헌\", \"⑤\", \"돈\", \"專\", \"춧\", \"중\", \"육\", \"휙\", \"엎\", \"쵸\", \"각\", \"더\", \"규\", \"쁨\", \"끽\", \"@\", \"»\", \"폭\", \"숭\", \"곶\", \"🙇\", \"환\", \"택\", \"팅\", \"볶\", \"ʏ\", \"쥔\", \"리\", \"뻔\", \"풀\", \"개\", \"뵐\", \"많\", \"ń\", \"킷\", \"생\", \"융\", \"라\", \"병\"]",
"reversible": false
},
"tohoku-nlp/bert-base-japanese @ cc100/zh-Hans": {
"tokenizer": "bert-base-japanese",
"organization": "Tohoku",
"vocab_size": 32000,
"_n_bytes": 2633047,
"_n_tokens": 633038,
"_n_chars": 927311,
"_n_oov_chars": 391681,
"oov_ratio": 0.42238364475348616,
"_oov_charset": "[\"T\", \"申\", \"舰\", \"辩\", \"赡\", \"卷\", \"哎\", \"博\", \"谀\", \"岂\", \"力\", \"委\", \"唏\", \"婺\", \"叉\", \"滓\", \"黯\", \"1\", \"液\", \"烘\", \"福\", \"蓝\", \"饭\", \"全\", \"敝\", \"净\", \"漓\", \"似\", \"翘\", \"丫\", \"粽\", \"啃\", \"喻\", \"V\", \"龇\", \"牲\", \"装\", \"核\", \"惰\", \"报\", \"寨\", \"缸\", \"掏\", \"颈\", \"箍\", \"晰\", \"迎\", \"窗\", \"雏\", \"猎\", \"雌\", \"拨\", \"冷\", \"M\", \"法\", \"呆\", \"汐\", \"袖\", \"砖\", \"菁\", \"整\", \"晕\", \"炒\", \"锤\", \"舐\", \"抑\", \"爆\", \"墙\", \"败\", \"碳\", \"泡\", \"的\", \"惯\", \"鉴\", \"秒\", \"壕\", \"瀛\", \"坡\", \"至\", \"浏\", \"嫉\", \"营\", \"礴\", \"怵\", \"彪\", \"谜\", \"娅\", \"辜\", \"封\", \"排\", \"凹\", \"咀\", \"寺\", \"统\", \"烬\", \"爸\", \"耸\", \"壓\", \"丛\", \"带\", \"砍\", \"撩\", \"尔\", \"情\", \"撞\", \"嗅\", \"匙\", \"时\", \"听\", \"犰\", \"涯\", \"递\", \"幽\", \"惮\", \"哒\", \"迷\", \"殊\", \"慰\", \"俨\", \"茵\", \"窿\", \"柳\", \"坐\", \"鹕\", \"沓\", \"微\", \"差\", \"珀\", \"傲\", \"匀\", \"优\", \"耶\", \"骰\", \"阀\", \"纰\", \"栏\", \"燃\", \"贾\", \"曲\", \"庚\", \"卡\", \"快\", \"经\", \"宾\", \"姻\", \"龟\", \"撸\", \"ό\", \"烊\", \"谱\", \"坂\", \"惧\", \"讨\", \"兴\", \"寸\", \"烛\", \"芮\", \"瘦\", \"叙\", \"虞\", \"槿\", \"瑰\", \"莉\", \"篱\", \"欺\", \"会\", \"顷\", \"傻\", \"猛\", \"籽\", \"看\", \"局\", \"开\", \"插\", \"坏\", \"矛\", \"马\", \"铛\", \"徊\", \"逢\", \"陆\", \"墅\", \"羞\", \"剂\", \"生\", \"把\", \"肉\", \"饶\", \"勺\", \"出\", \"扭\", \"髦\", \"先\", \"澳\", \"与\", \"拍\", \"面\", \"埋\", \"缪\", \"[\", \"醉\", \"托\", \"啡\", \"蹊\", \"罐\", \"蓉\", \"巧\", \"延\", \"嘴\", \"杯\", \"旁\", \"呜\", \"能\", \"摘\", \"樊\", \"寿\", \"笆\", \"颇\", \"侍\", \"盲\", \"熹\", \"话\", \"贝\", \"侠\", \"邹\", \"幢\", \"或\", \"捏\", \"计\", \"借\", \"哮\", \"垢\", \"溜\", \"穿\", \"仓\", \"洋\", \"综\", \"曳\", \"黔\", \"柱\", \"伺\", \"洪\", \"臂\", \"章\", \"淇\", \"辣\", \"挥\", \"手\", \"个\", \"朦\", \"泣\", \"糯\", \"愿\", \"者\", \"赃\", \"涩\", \"典\", \"领\", \"稳\", \"唬\", \"墉\", \"巩\", \"豪\", \"藐\", \"注\", \"因\", \"凯\", \"剥\", \"甘\", \"選\", \"悉\", \"喝\", \"苏\", \"畴\", \"冈\", \"链\", \"贵\", \"俭\", \"秃\", \"剧\", \"孤\", \"等\", \"享\", \"汉\", \"贮\", \"铎\", \"恃\", \"大\", \"帖\", \"已\", \"眩\", \"栖\", \"弃\", \"束\", \"男\", \"丘\", \"璧\", \"页\", \"良\", \"记\", \"茎\", \"河\", \"咙\", \"钦\", \"饥\", \"敬\", \"蹦\", \"喃\", \"镳\", \"乙\", \"女\", \"搜\", \"斋\", \"邑\", \"滚\", \"蚀\", \"邮\", \"史\", \"邯\", \"璎\", \"溅\", \"犹\", \"譬\", \"眨\", \"兽\", \"伍\", \"天\", \"焦\", \"寓\", \"答\", \"线\", \"偻\", \"誉\", \"凰\", \"钓\", \"罪\", \"捧\", \"俄\", \"质\", \"脾\", \"消\", \"更\", \"祷\", \"妹\", \"嚷\", \"铸\", \"o\", \"识\", \"续\", \"糟\", \"雁\", \"娴\", \"罢\", \"祥\", \"毯\", \"碗\", \"弟\", \"品\", \"钝\", \"辕\", \"鞋\", \"猫\", \"单\", \"蠢\", \"髓\", \"爰\", \"隙\", \"浇\", \"夷\", \"唯\", \"欧\", \"虱\", \"厥\", \"烷\", \"还\", \"钧\", \"值\", \"绝\", \"再\", \"毗\", \"帆\", \"相\", \"短\", \"姐\", \"雄\", \"斯\", \"扯\", \"湃\", \"梁\", \"嫂\", \"跃\", \"r\", \"屏\", \"魇\", \"瑥\", \"保\", \"要\", \"秋\", \"州\", \"稣\", \"浙\", \"脚\", \"窥\", \"辽\", \"房\", \"藉\", \"轼\", \"下\", \"地\", \"狗\", \"堡\", \"雍\", \"绕\", \"聚\", \"采\", \"喷\", \"澈\", \"四\", \"艳\", \"富\", \"礁\", \"渴\", \"徽\", \"世\", \"萍\", \"偿\", \"锚\", \"徙\", \"湘\", \"余\", \"愤\", \"耦\", \"彤\", \"炝\", \"座\", \"远\", \"捅\", \"魅\", \"俑\", \"i\", \"篓\", \"价\", \"狡\", \"聋\", \"泵\", \"鸠\", \"熨\", \"污\", \"淹\", \"肋\", \"犷\", \"幸\", \"违\", \"靛\", \"肚\", \"嘟\", \"英\", \"我\", \"戸\", \"伞\", \"5\", \"导\", \"撇\", \"茅\", \"雇\", \"媒\", \"殖\", \"圩\", \"昵\", \"彭\", \"陕\", \"吠\", \"除\", \"韩\", \"是\", \"渊\", \"度\", \"啤\", \"逗\", \"饰\", \"惺\", \"宿\", \"绣\", \"谬\", \"d\", \"瞒\", \"⑨\", \"队\", \"境\", \"祟\", \"彬\", \"筝\", \"霞\", \"凌\", \"邦\", \"爻\", \"术\", \"肆\", \"臃\", \"锈\", \"陵\", \"七\", \"丹\", \"槛\", \"壳\", \"镏\", \"刘\", \"晨\", \"炕\", \"物\", \"闲\", \"幼\", \"媛\", \"急\", \"躲\", \"痕\", \"麦\", \"树\", \"偎\", \".\", \"屄\", \"卢\", \"去\", \"之\", \"乓\", \"街\", \"古\", \"哦\", \"吱\", \"喉\", \"库\", \"严\", \"撼\", \"巾\", \"于\", \"找\", \"熊\", \"随\", \"门\", \"罩\", \"诙\", \"测\", \"皱\", \"贞\", \"屁\", \"竟\", \"熏\", \"交\", \"减\", \"沂\", \"干\", \"於\", \"啪\", \"瞧\", \"痛\", \"起\", \"腥\", \"旺\", \"蹈\", \"植\", \"蕴\", \"募\", \"仇\", \"数\", \"泱\", \"破\", \"珞\", \"淫\", \"惑\", \"畜\", \"媚\", \"恨\", \"∶\", \"辆\", \"魏\", \"陈\", \"幻\", \"纨\", \"奢\", \"高\", \"渡\", \"石\", \"编\", \"竞\", \"彷\", \"区\", \"搂\", \"邵\", \"版\", \"嘈\", \"小\", \"缥\", \"互\", \"菇\", \"⒀\", \"沮\", \"午\", \"刹\", \"潮\", \"绛\", \"翼\", \"叨\", \"鹰\", \"此\", \"牺\", \"憔\", \"鹌\", \"桃\", \"榻\", \"利\", \"层\", \"躁\", \"迁\", \"啥\", \"睫\", \"芜\", \"劝\", \"梧\", \"芒\", \"萃\", \"遏\", \"梨\", \"馒\", \"粉\", \"关\", \"撐\", \"而\", \"针\", \"_\", \"身\", \"t\", \"少\", \"音\", \"挺\", \"唠\", \"森\", \"滩\", \"冰\", \"锂\", \"姑\", \"泊\", \"胳\", \"扛\", \"喇\", \"职\", \"俯\", \"乐\", \"回\", \"倍\", \"凿\", \"牌\", \"震\", \"灰\", \"屑\", \"印\", \"麓\", \"打\", \"搡\", \"颓\", \"抄\", \"D\", \""\", \"←\", \"西\", \"威\", \"芳\", \"渐\", \"楚\", \"脖\", \"裴\", \"颁\", \"寞\", \"贯\", \"舟\", \"酌\", \"何\", \"文\", \"龚\", \"莴\", \"\", \"椅\", \"杂\", \"泉\", \"蘸\", \"辈\", \"懊\", \"铝\", \"泼\", \"灶\", \"早\", \"请\", \"嘎\", \"蚌\", \"噱\", \"通\", \"僻\", \"匆\", \"妇\", \"潘\", \"吵\", \"摸\", \"押\", \"馆\", \"勇\", \"淞\", \"圆\", \"合\", \"蒋\", \"昕\", \"3\", \"烫\", \"泪\", \"灼\", \"母\", \"哄\", \"漪\", \"赁\", \"裁\", \"谨\", \"陷\", \"踢\", \"填\", \"云\", \"價\", \"鬣\", \"苒\", \"茱\", \"璃\", \"牠\", \"偏\", \"眼\", \"恿\", \"水\", \"吊\", \"腓\", \"妖\", \"中\", \"刊\", \"耳\", \"留\", \"玮\", \"杖\", \"掩\", \"半\", \"危\", \"平\", \"明\", \"适\", \"述\", \"咖\", \"儒\", \"篷\", \"抬\", \"扔\", \"爬\", \"靶\", \"盈\", \"崛\", \"薯\", \"寻\", \"怠\", \"凭\", \"举\", \"y\", \"沐\", \"•\", \"技\", \"献\", \"挝\", \"月\", \"腑\", \"N\", \"斗\", \"骄\", \"滋\", \"滇\", \"苇\", \"疑\", \"踩\", \"\", \"八\", \"s\", \"匠\", \"峥\", \"席\", \"虫\", \"毒\", \"浠\", \"搬\", \"渣\", \"解\", \"棠\", \"墨\", \"沿\", \"蜡\", \"柬\", \"“\", \"正\", \"蚓\", \"熬\", \"些\", \"杰\", \"芯\", \"另\", \"长\", \"辐\", \"雷\", \"酸\", \"锒\", \"飞\", \"态\", \"肌\", \"憬\", \"妻\", \"晖\", \"牙\", \"臀\", \"谷\", \"病\", \"亡\", \"陨\", \"囤\", \"嘻\", \"讳\", \"遐\", \"甫\", \"特\", \"悔\", \"桂\", \"存\", \"虏\", \"包\", \"义\", \"穴\", \"巅\", \"醛\", \"按\", \"书\", \"拂\", \"脐\", \"移\", \"遗\", \"车\", \"筛\", \"咚\", \"姥\", \"氰\", \"凉\", \"垒\", \"溉\", \"收\", \"膊\", \"炊\", \"推\", \"蜷\", \"斩\", \"厢\", \"浚\", \"副\", \"界\", \"但\", \"挑\", \"贤\", \"琴\", \"焕\", \"对\", \"脑\", \"蔬\", \"造\", \"伫\", \"症\", \"拐\", \"垠\", \"功\", \"驶\", \"科\", \"奥\", \"-\", \"鲤\", \"疙\", \"竹\", \"钊\", \"购\", \"舞\", \"裘\", \"仿\", \"轶\", \"居\", \"垄\", \"餐\", \"即\", \"壤\", \"该\", \"蜴\", \"個\", \"运\", \"侄\", \"宋\", \"理\", \"行\", \"阶\", \"悄\", \"袭\", \"牒\", \"璀\", \"邀\", \"励\", \"苑\", \"景\", \"绽\", \"侥\", \"锯\", \"8\", \"钱\", \"嫌\", \"葆\", \"袁\", \"刨\", \"e\", \"哈\", \"哭\", \"受\", \"著\", \"妤\", \"郊\", \"光\", \"浸\", \"耩\", \"宣\", \"擅\", \"萌\", \"删\", \"C\", \"赵\", \"t\", \"疾\", \"茜\", \"Ø\", \"涛\", \"询\", \"砺\", \"蔓\", \"邓\", \"遥\", \"劈\", \"兮\", \"趁\", \"峻\", \"叔\", \"娶\", \"煲\", \"拱\", \"灾\", \"⒃\", \"点\", \"ς\", \"布\", \"播\", \"笨\", \"⑿\", \"亲\", \"霹\", \"塘\", \"碱\", \"玻\", \"扳\", \"惕\", \"瞰\", \"遮\", \"背\", \"抛\", \"疵\", \"赢\", \"揣\", \"字\", \"©\", \"缭\", \"辫\", \"揍\", \"d\", \"超\", \"玫\", \"停\", \"狈\", \"焊\", \"钥\", \"阮\", \"糠\", \"棱\", \"骆\", \"本\", \"煤\", \"掺\", \"稿\", \"召\", \"错\", \"取\", \"淘\", \"熟\", \"荣\", \"敖\", \"零\", \"眉\", \"凶\", \"遵\", \"涣\", \"顿\", \"乏\", \"例\", \"嵌\", \"舒\", \"如\", \"眯\", \"守\", \"伦\", \"吃\", \"芃\", \"橇\", \"枢\", \"套\", \"喂\", \"跷\", \"垛\", \"笼\", \"宜\", \"缝\", \"曼\", \"帽\", \"逐\", \"汤\", \"稽\", \"燕\", \"向\", \"猬\", \"囊\", \"朋\", \"疴\", \"拳\", \"彦\", \"迪\", \"跪\", \"成\", \"融\", \"郭\", \"肇\", \"血\", \"芝\", \"嘱\", \"柄\", \"农\", \"萝\", \"璨\", \"鼾\", \"攻\", \"啬\", \"咬\", \"悠\", \"焉\", \"藕\", \"羔\", \"资\", \"腾\", \"h\", \"玷\", \"显\", \"凳\", \"刺\", \"`\", \"劣\", \"缈\", \"府\", \"译\", \"妓\", \"屌\", \"辄\", \"梵\", \"滔\", \"轿\", \"影\", \"贴\", \"退\", \"铜\", \"颉\", \"露\", \"螂\", \"掳\", \"蜕\", \"呛\", \"拙\", \"赏\", \"虹\", \"揖\", \"庆\", \"锦\", \"邱\", \"附\", \"颖\", \"给\", \"-\", \"裆\", \"k\", \"祝\", \"宏\", \"犀\", \"⑴\", \"红\", \"睿\", \"砥\", \"蓄\", \"濒\", \"晤\", \"卫\", \"黛\", \"呢\", \"肩\", \"糖\", \"意\", \"览\", \"峡\", \"咒\", \"扮\", \"辞\", \"勉\", \"忿\", \"胫\", \"琅\", \"轮\", \"貂\", \"6\", \"笑\", \"毕\", \"晓\", \"勘\", \"否\", \"炸\", \"育\", \"趴\", \"证\", \"癜\", \"苟\", \"胧\", \"桅\", \"目\", \"瑧\", \"甚\", \"蚯\", \"娄\", \"牖\", \"却\", \"盗\", \"帷\", \"馨\", \"婚\", \"尾\", \"奂\", \"照\", \"爷\", \"哟\", \"俱\", \"桓\", \"挨\", \"葫\", \"武\", \"驼\", \"贬\", \"具\", \"寄\", \"逍\", \"菜\", \"崩\", \"拯\", \"电\", \"孜\", \"茧\", \"闾\", \"孰\", \"蝉\", \"鲁\", \"犟\", \"班\", \"à\", \"乾\", \"辅\", \"稠\", \"冲\", \"霈\", \"海\", \"毁\", \"苍\", \"舅\", \"琪\", \"屡\", \"啕\", \"耘\", \"途\", \"掌\", \"呸\", \"屎\", \"攸\", \"众\", \"游\", \"太\", \"轻\", \"姨\", \"险\", \"羽\", \"賣\", \"罔\", \"兆\", \"浪\", \"锡\", \"⑧\", \"散\", \"恳\", \"温\", \"茂\", \"屿\", \"陶\", \"矗\", \"慕\", \"℃\", \"宁\", \"馄\", \"软\", \"寂\", \"愉\", \"粒\", \"聪\", \"俚\", \"峭\", \"了\", \"峙\", \"戚\", \"鸟\", \"嚣\", \"憧\", \"邢\", \"图\", \"劲\", \"刻\", \"淋\", \"暴\", \"序\", \"箱\", \"渤\", \"绊\", \"据\", \"畸\", \"鼯\", \"腐\", \"鸦\", \"繁\", \"螃\", \"柜\", \"含\", \"惘\", \"湄\", \"咏\", \"荧\", \"剽\", \"呀\", \"號\", \"n\", \"废\", \"\", \"朵\", \"负\", \"逻\", \"飚\", \"银\", \"讪\", \"篢\", \"佝\", \"垂\", \"戳\", \"鼓\", \"救\", \"炎\", \"穰\", \"〖\", \"际\", \"叹\", \"倾\", \"师\", \"航\", \"虐\", \"刀\", \".\", \"阿\", \"匾\", \"旌\", \"盛\", \"贱\", \"赫\", \"掀\", \"飘\", \"棘\", \"头\", \"挖\", \"攒\", \"项\", \"嫁\", \"侨\", \"甬\", \"潢\", \"韧\", \"协\", \"仔\", \"H\", \"镑\", \"兼\", \"偶\", \"烤\", \"缄\", \"牛\", \"颐\", \"执\", \"拆\", \"铲\", \"顺\", \"两\", \"丽\", \"旆\", \"珍\", \"滴\", \"挂\", \"拷\", \"准\", \"懒\", \"锋\", \"栾\", \"倨\", \"孱\", \"堰\", \"养\", \"凤\", \"怀\", \"戒\", \"聘\", \"伏\", \"润\", \"配\", \"镉\", \"窍\", \"拓\", \"笔\", \"观\", \"翠\", \"渝\", \"训\", \"惋\", \"怕\", \"淼\", \"铄\", \"级\", \"限\", \"体\", \"踱\", \"殉\", \"卦\", \"哥\", \"直\", \"缴\", \"空\", \"轩\", \"周\", \"逸\", \"邂\", \"终\", \"异\", \"漂\", \"鼎\", \"郴\", \"驮\", \"嵘\", \"决\", \"床\", \"腻\", \"蔡\", \"鸡\", \"占\", \"膨\", \"挡\", \"喆\", \"ὐ\", \"确\", \"禧\", \"偷\", \"误\", \"抢\", \"珊\", \"衿\", \"抡\", \"戛\", \"挚\", \"饷\", \"亂\", \"多\", \"票\", \"才\", \"躇\", \"允\", \"临\", \"冬\", \"贺\", \"气\", \"几\", \"纹\", \"壹\", \"嗨\", \"钵\", \"盐\", \"琐\", \"派\", \"完\", \"丈\", \"氏\", \"堤\", \"荻\", \"ù\", \"启\", \"迈\", \"培\", \"想\", \"池\", \"揭\", \"各\", \"魄\", \"让\", \"浓\", \"阔\", \"3\", \"墟\", \"供\", \"催\", \"嫩\", \"拘\", \"付\", \"院\", \"甸\", \"a\", \"这\", \"蛙\", \"煎\", \"毫\", \"贫\", \"晃\", \"驾\", \"嘭\", \"锲\", \"炭\", \"逼\", \"粥\", \"扇\", \"鹑\", \"崎\", \"敛\", \"涌\", \"痒\", \"奉\", \"织\", \"撤\", \"裹\", \"型\", \"咳\", \"惜\", \"柔\", \"睬\", \"索\", \"兹\", \"蒿\", \"挈\", \"倩\", \"同\", \"汝\", \"瓣\", \"猪\", \"灑\", \"衅\", \"翰\", \"朗\", \"商\", \"畏\", \"憨\", \"遇\", \"坑\", \"饮\", \"锐\", \"呗\", \"荆\", \"摒\", \"疮\", \"枪\", \"蚂\", \"揽\", \"彩\", \"茸\", \"有\", \"彗\", \"臆\", \"候\", \"橱\", \"总\", \"欣\", \"旧\", \"鄯\", \"钩\", \"亿\", \"歧\", \"颠\", \"巍\", \"勋\", \"\\b\", \"斑\", \"组\", \"架\", \"镶\", \"锢\", \"溢\", \"堂\", \"坛\", \"逃\", \"补\", \"挠\", \"蔚\", \"谛\", \"服\", \"甯\", \"楼\", \"剔\", \"摊\", \"楷\", \"球\", \"黝\", \"蹒\", \"ο\", \"奸\", \"覃\", \"棍\", \"由\", \":\", \"普\", \"聒\", \"侃\", \"瘾\", \"迤\", \"邬\", \"跨\", \"类\", \"伐\", \"茏\", \"榜\", \"涕\", \"绑\", \"裸\", \"知\", \"桶\", \"钉\", \"慷\", \"隧\", \"馏\", \"诣\", \"豌\", \"秉\", \"吸\", \"昭\", \"耽\", \"困\", \"鸥\", \"橡\", \"题\", \"许\", \"剿\", \"轨\", \"倏\", \"慈\", \"深\", \"薰\", \"信\", \"故\", \"谩\", \"屉\", \"括\", \"侈\", \"谑\", \"悼\", \"佼\", \"棚\", \"狐\", \"標\", \"城\", \"缓\", \"浑\", \"制\", \"油\", \"邻\", \"曹\", \"右\", \"玳\", \"为\", \"策\", \"怪\", \"旗\", \"酪\", \"撒\", \"需\", \"…\", \"盆\", \"瞥\", \"孀\", \"甄\", \"隶\", \"B\", \"戾\", \"钰\", \"郡\", \"镇\", \"甜\", \"障\", \"揪\", \"溯\", \"施\", \"路\", \"充\", \"暑\", \"4\", \"检\", \"结\", \"语\", \"毙\", \"阅\", \"截\", \"士\", \"紊\", \"卿\", \"忐\", \"熔\", \"揉\", \"拖\", \"霉\", \"入\", \"胺\", \"藏\", \"阽\", \"波\", \"狞\", \"言\", \"越\", \"机\", \"骚\", \"侦\", \"皑\", \"诩\", \"糊\", \"心\", \"硅\", \"枝\", \"铭\", \"仄\", \"吓\", \"厨\", \"撕\", \"夹\", \"佣\", \"佟\", \"授\", \"友\", \"蒂\", \"矶\", \"挫\", \"苯\", \"沼\", \"夜\", \"横\", \"①\", \"昧\", \"冯\", \"纾\", \"籁\", \"练\", \"瘠\", \"鲨\", \"棂\", \"浩\", \"棒\", \"谍\", \"县\", \"徘\", \"倡\", \"蝗\", \"煽\", \"c\", \"衬\", \"垃\", \"珏\", \"董\", \"楣\", \"张\", \"爹\", \"姚\", \"喔\", \"阵\", \"腭\", \"沏\", \"牟\", \"垮\", \"克\", \"黄\", \"嗤\", \"戮\", \"逑\", \"奚\", \"炼\", \"止\", \"密\", \"牵\", \"诃\", \"朝\", \"2\", \"逞\", \"勖\", \"吝\", \"纬\", \"\\u0007\", \"拢\", \"变\", \"尝\", \"讦\", \"乎\", \"响\", \"喽\", \"隆\", \"康\", \"尼\", \"射\", \"奖\", \"教\", \"叶\", \"發\", \"秆\", \"倒\", \"帘\", \"田\", \"姓\", \"坦\", \"简\", \"蕉\", \"青\", \"灸\", \"怎\", \"健\", \"浊\", \"弊\", \"满\", \"依\", \"晚\", \"铺\", \"来\", \"仙\", \"傥\", \"圭\", \"鸿\", \"廓\", \"六\", \"样\", \"妈\", \"饼\", \"昏\", \"詹\", \"香\", \"樯\", \"荨\", \"柠\", \"潜\", \"枯\", \"渺\", \"符\", \"潭\", \"阴\", \"板\", \"辗\", \"绞\", \"鲎\", \"抵\", \"臊\", \"丁\", \"绘\", \"江\", \"瞠\", \"巡\", \"监\", \"圜\", \"恋\", \"泽\", \"⑩\", \"褒\", \"汀\", \"ç\", \"浞\", \"肛\", \"岁\", \"不\", \"骤\", \"噪\", \"v\", \"鼻\", \"染\", \"仰\", \"极\", \"m\", \"尚\", \"泠\", \"觉\", \"莞\", \"室\", \"暂\", \"酱\", \"政\", \"管\", \"清\", \"查\", \"雨\", \"侯\", \"昆\", \"量\", \"谓\", \"莓\", \"捂\", \"豹\", \"逝\", \"炬\", \"呼\", \"莺\", \"鬓\", \"处\", \"苣\", \"川\", \")\", \"嘣\", \"恙\", \"松\", \"息\", \"外\", \"忍\", \"寐\", \"逆\", \"啜\", \"沉\", \"徨\", \"逊\", \"麽\", \",\", \"狙\", \"条\", \"迅\", \"睐\", \"讷\", \"讯\", \"恺\", \"骑\", \"霄\", \"焙\", \"豆\", \"隔\", \"敦\", \"凋\", \"嚎\", \"雾\", \"萎\", \"蜒\", \"乍\", \"\", \"啸\", \"剁\", \"砸\", \"愕\", \"争\", \"嘲\", \"怨\", \"咪\", \"亭\", \"虾\", \"压\", \"权\", \"梗\", \"�\", \"唷\", \"掬\", \"翊\", \"悍\", \"烁\", \"势\", \"膏\", \"胸\", \"2\", \"材\", \"遴\", \"忠\", \"蜘\", \"频\", \"碾\", \"⑦\", \"追\", \"苦\", \"济\", \"糕\", \"腺\", \"圈\", \"疲\", \"秘\", \"岭\", \"谧\", \"卍\", \"衍\", \"访\", \"嗲\", \"镀\", \"呃\", \"赠\", \"洼\", \"萧\", \"脸\", \"唐\", \"木\", \"乌\", \"桩\", \"咱\", \"i\", \"婶\", \"共\", \"暖\", \"娟\", \"漫\", \"恒\", \"絮\", \"谴\", \"俘\", \"饨\", \"佬\", \"宛\", \"惩\", \"宇\", \"锁\", \"溘\", \"扪\", \"涉\", \"汕\", \"曾\", \"誓\", \"咨\", \"巢\", \"第\", \"端\", \"改\", \"磕\", \"夸\", \"被\", \"袍\", \"德\", \"啼\", \"犯\", \"缅\", \"缘\", \"淆\", \"津\", \"惬\", \"节\", \"淡\", \"梯\", \"稻\", \"边\", \"晗\", \"亏\", \"么\", \"鹃\", \"扶\", \"砧\", \"莱\", \"省\", \"瞪\", \"廖\", \"倪\", \"黑\", \"囚\", \"幅\", \"辉\", \"捕\", \"岚\", \"激\", \"寒\", \"逅\", \"壮\", \"孝\", \"晶\", \"崽\", \"庞\", \"醋\", \"扁\", \"屯\", \"飙\", \"暹\", \"鲜\", \"圾\", \"漲\", \"哧\", \"忧\", \"渗\", \"则\", \"卧\", \"摩\", \"栈\", \"⑶\", \"驴\", \"诺\", \"酬\", \"事\", \"携\", \"孪\", \"愚\", \"霖\", \"握\", \"华\", \"骸\", \"抠\", \"\", \"速\", \"句\", \"塞\", \"丢\", \"警\", \"吆\", \"验\", \"颗\", \"滞\", \"漩\", \"忑\", \"擞\", \"溺\", \"巨\", \"膛\", \"锏\", \"桔\", \"热\", \"蚁\", \"剩\", \"规\", \"洁\", \"厝\", \"屈\", \"萄\", \"堵\", \"擂\", \"详\", \"蛇\", \"迹\", \"俗\", \"躬\", \"比\", \"况\", \"瓢\", \"党\", \"煌\", \"◆\", \"燎\", \"徇\", \"琶\", \"p\", \"吐\", \"荫\", \"〞\", \"赎\", \"捆\", \"谚\", \"蜃\", \"绪\", \"获\", \"暄\", \"攀\", \"铃\", \"钜\", \"雯\", \"嘛\", \"罚\", \"斛\", \"闵\", \"妒\", \"棣\", \"好\", \"哪\", \"霓\", \"它\", \"户\", \"茨\", \"往\", \"尽\", \"奘\", \"欠\", \"叠\", \"绿\", \"茁\", \"冒\", \"讲\", \"域\", \"辨\", \"蒙\", \"战\", \"椰\", \"5\", \"秤\", \"狭\", \"遛\", \"灯\", \"联\", \"x\", \"夏\", \"岌\", \"扰\", \"弱\", \"铩\", \"\\u0000\", \"贡\", \"姣\", \"款\", \"着\", \"辛\", \"翁\", \"矩\", \"熄\", \"岔\", \"聿\", \"金\", \"嗯\", \"9\", \"尿\", \"妆\", \"忽\", \"凡\", \"顶\", \"狼\", \"湮\", \"黧\", \"刑\", \"每\", \"孟\", \"触\", \"踞\", \"吗\", \"在\", \"翡\", \"洽\", \"氯\", \"酣\", \"滤\", \"窃\", \"然\", \"弛\", \"近\", \"呐\", \"鳗\", \"谈\", \"李\", \"盹\", \"歹\", \"遍\", \"令\", \"角\", \"弄\", \"校\", \"\", \"达\", \"婷\", \"甩\", \"休\", \"虑\", \"持\", \"械\", \"萤\", \"狂\", \"樱\", \"佳\", \"琛\", \"率\", \"漉\", \"霾\", \"惫\", \"秩\", \"涸\", \"谣\", \"犬\", \"傍\", \"家\", \"②\", \"涤\", \"褚\", \"杏\", \"增\", \"闹\", \"奠\", \"趟\", \"凝\", \"感\", \"埔\", \"形\", \"胎\", \"玛\", \"应\", \"渠\", \"臣\", \"燥\", \"饽\", \"艺\", \"磨\", \"坚\", \"懈\", \"踪\", \"串\", \"使\", \"暇\", \"⒌\", \"鹜\", \"换\", \"趣\", \"律\", \"阁\", \"萦\", \"刷\", \"泻\", \"缚\", \"忱\", \"旨\", \"磊\", \"鸩\", \"帕\", \"添\", \"敏\", \"汶\", \"赚\", \"畅\", \"馈\", \"乞\", \"瑢\", \"迟\", \"岣\", \"亮\", \"蛊\", \"扼\", \"恍\", \"塑\", \"独\", \"岖\", \"尊\", \"橄\", \"阑\", \"嗪\", \"唤\", \"矣\", \"慧\", \"磋\", \"淌\", \"童\", \"眶\", \"免\", \"食\", \"昨\", \"〗\", \"担\", \"系\", \"厚\", \"醇\", \"竺\", \"〃\", \"夕\", \"住\", \"范\", \"皖\", \"十\", \"娛\", \"船\", \"柏\", \"惨\", \"榨\", \"ㄓ\", \"迄\", \"佛\", \"瑕\", \"奏\", \"丙\", \"娑\", \"叫\", \"媳\", \"涂\", \"陡\", \"兢\", \"概\", \"沁\", \"务\", \"驻\", \"娱\", \"缕\", \"赴\", \"振\", \"榴\", \"汗\", \"梦\", \"挣\", \"沧\", \"宗\", \"龄\", \"己\", \"惠\", \"帐\", \"叭\", \"扬\", \"效\", \"慎\", \"熙\", \"穹\", \"侬\", \"蜂\", \"岛\", \"蔽\", \"害\", \"绵\", \"售\", \"蘑\", \"兄\", \"澎\", \"尘\", \"均\", \"别\", \"/\", \"赶\", \"酝\", \"指\", \"噩\", \"讽\", \"诬\", \"仕\", \"佰\", \"集\", \"梅\", \"考\", \"悯\", \"真\", \"员\", \"槃\", \"仁\", \"烯\", \"缜\", \"混\", \"懦\", \"奶\", \"学\", \"次\", \"烹\", \"蟑\", \"定\", \"蜜\", \"蔷\", \"鹏\", \"搁\", \"客\", \"纯\", \"蕤\", \"削\", \"瓦\", \"彙\", \"丝\", \"栅\", \"表\", \"汽\", \"调\", \"朔\", \"围\", \"貌\", \"嚼\", \"飕\", \"瞻\", \"堪\", \"孽\", \"爱\", \"袱\", \"劾\", \"所\", \"火\", \"伟\", \"苛\", \"\\u0006\", \"刁\", \"绳\", \"伯\", \"獗\", \"肮\", \"舀\", \"粹\", \"裔\", \"阂\", \"疤\", \"ě\", \"齐\", \"榆\", \"棋\", \"玲\", \"乘\", \"捞\", \"断\", \"味\", \"弯\", \"诊\", \"裂\", \"乱\", \"固\", \"烃\", \"’\", \"疸\", \"紧\", \"叼\", \"诲\", \"粮\", \"约\", \"伸\", \"左\", \"狮\", \"瓜\", \"尤\", \"辖\", \"蟀\", \"漠\", \"诗\", \"桢\", \"雅\", \"梳\", \"奴\", \"槐\", \"届\", \"碍\", \"闭\", \"拒\", \"怡\", \"鹦\", \"和\", \"反\", \"嗓\", \"權\", \"距\", \"滢\", \"鹅\", \"部\", \"屹\", \"亳\", \"化\", \"惚\", \"磺\", \"词\", \"镍\", \"课\", \"矿\", \"镭\", \"叛\", \"骅\", \"私\", \"狄\", \"τ\", \"俏\", \"箭\", \"茄\", \"送\", \"莹\", \"闯\", \"沪\", \"忪\", \"椭\", \"仪\", \"檬\", \"黢\", \"坷\", \"怔\", \"替\", \"重\", \"瀑\", \"觑\", \"莲\", \"浴\", \"环\", \"弘\", \"叮\", \"描\", \"精\", \"较\", \"瘩\", \"巴\", \"神\", \"蜿\", \"殷\", \"筐\", \"北\", \"④\", \"拧\", \"未\", \"樟\", \"季\", \"鹉\", \"名\", \"彻\", \"企\", \"厅\", \"靓\", \"砌\", \"怂\", \"抱\", \"荒\", \"隐\", \"馅\", \"矫\", \"趋\", \"亵\", \"庭\", \"吁\", \"稀\", \"婊\", \"当\", \"霭\", \"霆\", \"号\", \"绩\", \"丸\", \"牢\", \"禾\", \"冽\", \"租\", \"忡\", \"加\", \"枣\", \"诫\", \"踝\", \"仆\", \"勿\", \"姿\", \"妞\", \"羡\", \"防\", \"袜\", \"舱\", \"援\", \"亚\", \"夥\", \"溃\", \"诚\", \"‘\", \"议\", \"娼\", \"创\", \"羹\", \"哇\", \"哲\", \"永\", \"昌\", \"拎\", \"台\", \"髻\", \"欢\", \"慌\", \"患\", \"锄\", \"郅\", \"沟\", \"说\", \"期\", \"鬼\", \"弧\", \"悲\", \"胖\", \"镐\", \"疏\", \"脏\", \"绍\", \"牧\", \"容\", \"搅\", \"将\", \"善\", \"网\", \"舌\", \";\", \"瞎\", \"念\", \"喧\", \"旬\", \"日\", \"模\", \"臭\", \"声\", \"涮\", \"阜\", \"尴\", \"摞\", \"骏\", \"尬\", \"撅\", \"镕\", \"肝\", \"鲱\", \"待\", \"③\", \"列\", \"î\", \"竭\", \"渎\", \"鳌\", \"咧\", \"泾\", \"屣\", \"淖\", \"玖\", \"饵\", \"扫\", \"贩\", \"产\", \"豫\", \"诵\", \"闷\", \"状\", \"抖\", \"耗\", \"遭\", \"卉\", \"腰\", \"恤\", \"莘\", \"宵\", \"晋\", \"庐\", \"歌\", \"支\", \"谢\", \"炳\", \"晟\", \"厌\", \"认\", \"属\", \"尹\", \"馍\", \"谅\", \"恭\", \"实\", \"郜\", \"犄\", \"遢\", \"踵\", \"锥\", \"拉\", \"粗\", \"噼\", \"易\", \"姬\", \"潇\", \"瑄\", \"您\", \"承\", \"艘\", \"麻\", \"溶\", \"蹿\", \"辰\", \"园\", \"径\", \"郑\", \"捉\", \"闺\", \"井\", \"自\", \"柯\", \"妍\", \"切\", \"衡\", \"嘿\", \"棕\", \"细\", \"杨\", \"盾\", \"⑥\", \"睛\", \"哑\", \"煮\", \"讶\", \"恐\", \"蚊\", \"跻\", \"源\", \"涨\", \"噌\", \"驭\", \"懑\", \"草\", \"罗\", \"怜\", \"绷\", \"壁\", \"旦\", \"唾\", \"狳\", \"孕\", \"煜\", \"徐\", \"喱\", \"蹭\", \"踏\", \"↑\", \"足\", \"躯\", \"鸣\", \"叩\", \"劳\", \"百\", \"忆\", \"敌\", \"啦\", \"姆\", \"毋\", \"瑑\", \"骇\", \"杉\", \"眷\", \"谁\", \"昊\", \"恢\", \"赣\", \"蹲\", \"辱\", \"进\", \"戈\", \"闸\", \"仲\", \"猜\", \"麟\", \"刚\", \"征\", \" \", \"毅\", \"⒂\", \"诀\", \"基\", \"桥\", \"作\", \"琳\", \"捐\", \"星\", \"沃\", \"社\", \"击\", \"扎\", \"尸\", \"立\", \"拜\", \"蟹\", \"得\", \"甲\", \"芷\", \"躺\", \"厦\", \"诟\", \"药\", \"纷\", \"悖\", \"促\", \"垫\", \"塔\", \"蔑\", \"察\", \"到\", \"纺\", \"诶\", \"窟\", \"卵\", \"东\", \"军\", \"陌\", \"讼\", \"穷\", \"片\", \"耍\", \"戢\", \"泯\", \"铣\", \"晦\", \"弗\", \"契\", \"予\", \"檐\", \"五\", \"颧\", \"位\", \"盏\", \"翔\", \"傅\", \"象\", \"捡\", \"碌\", \"低\", \"劫\", \"贸\", \"纽\", \"洗\", \"涎\", \"方\", \"&\", \"猾\", \"匿\", \"丧\", \"诡\", \"抉\", \"亩\", \"历\", \"挤\", \"碎\", \"辟\", \"蕃\", \"7\", \"菱\", \"懂\", \"孙\", \"浅\", \"码\", \"歉\", \"肿\", \"茫\", \"诠\", \"灿\", \"戍\", \"冤\", \"羊\", \"漏\", \"株\", \"驳\", \"杆\", \"侣\", \"抒\", \"损\", \"梢\", \"载\", \"耙\", \"赌\", \"逶\", \"]\", \"诱\", \"昂\", \"戴\", \"底\", \"烦\", \"拦\", \"过\", \"勃\", \"椒\", \"秽\", \"裳\", \"诞\", \"原\", \"泄\", \"坝\", \"础\", \"廊\", \"佩\", \"伉\", \"搐\", \"纠\", \"赔\", \"殿\", \"储\", \"顾\", \"鲍\", \"券\", \"4\", \"芽\", \"那\", \"筷\", \"挪\", \"紫\", \"羁\", \"娘\", \"展\", \"倚\", \"剖\", \"千\", \"段\", \"婆\", \"琦\", \"窘\", \"丐\", \"冀\", \"岑\", \"悚\", \"S\", \"胶\", \"嘀\", \"白\", \"肤\", \"性\", \"槽\", \"兰\", \"b\", \"蜥\", \"噢\", \"仍\", \"虽\", \"飓\", \"墒\", \"九\", \"纳\", \"新\", \"桐\", \"酷\", \"擦\", \"陪\", \"屠\", \"奇\", \"珠\", \"掖\", \"砾\", \"晒\", \"始\", \"累\", \"怯\", \"肠\", \"肾\", \"凸\", \"弈\", \"轴\", \"莅\", \"拌\", \"妥\", \"俩\", \"赞\", \"歇\", \"澜\", \"诉\", \"媲\", \"祸\", \"滥\", \"督\", \"疆\", \"墓\", \"残\", \"年\", \"凑\", \"薄\", \"枷\", \"庙\", \"趾\", \"沽\", \"必\", \"沦\", \"惭\", \"归\", \"夺\", \"咆\", \"膝\", \"忙\", \"臻\", \"汰\", \"舍\", \"睽\", \"辙\", \"输\", \"贪\", \"谭\", \"栋\", \"瘀\", \"藤\", \"萨\", \"晴\", \"淑\", \"腊\", \"人\", \"懵\", \"艰\", \"蓬\", \"\", \"颤\", \"婪\", \"冠\", \"坟\", \"皙\", \"匮\", \"靡\", \"泰\", \"函\", \"式\", \"疼\", \"转\", \"颊\", \"韬\", \"汪\", \"疫\", \"戏\", \"米\", \"炉\", \"楂\", \"痊\", \"建\", \"拽\", \"皈\", \"寥\", \"痰\", \"菌\", \"纪\", \"纵\", \"帜\", \"⑸\", \"鹿\", \"参\", \"郸\", \"⒋\", \"恣\", \"且\", \"+\", \"摔\", \"磁\", \"胁\", \"葩\", \"暧\", \"悟\", \"é\", \"粪\", \"爽\", \"棺\", \"卤\", \"塌\", \"阱\", \"锌\", \"遁\", \"筑\", \"厘\", \"榭\", \"炖\", \"鹤\", \"澡\", \"艋\", \"涝\", \"艇\", \"猡\", \"旳\", \"扒\", \"试\", \"褪\", \")\", \"雳\", \"王\", \"慨\", \"榄\", \"洒\", \"尖\", \"剪\", \"就\", \"宽\", \"酒\", \"疚\", \"憋\", \"荏\", \"廷\", \"猩\", \"辑\", \"郝\", \"滑\", \"旖\", \"猴\", \"汛\", \"孔\", \"蚪\", \"皂\", \"蓦\", \"赤\", \"8\", \"假\", \"杭\", \"划\", \"掘\", \"吼\", \"奋\", \"⒁\", \"鸭\", \"斜\", \"选\", \"内\", \"朴\", \"挽\", \"拔\", \"抚\", \"降\", \"碰\", \"僵\", \"扣\", \"瑜\", \"蒜\", \"骼\", \"柘\", \"卓\", \"业\", \"活\", \"赛\", \"宙\", \"粱\", \"若\", \"芙\", \"键\", \"菲\", \"舆\", \"沛\", \"格\", \"掐\", \"擤\", \"葵\", \"狠\", \"件\", \"父\", \"绰\", \"置\", \"嘤\", \"浆\", \"读\", \"铮\", \"助\", \"捍\", \"埠\", \"婴\", \"喜\", \"诅\", \"噴\", \"裙\", \"栩\", \"案\", \"择\", \"致\", \"伴\", \"蚤\", \"晾\", \"雪\", \"抓\", \"斥\", \"〝\", \"闻\", \"沫\", \"婉\", \"咦\", \"纤\", \"沈\", \"坊\", \"筹\", \"嘘\", \"鄙\", \"氧\", \"预\", \"吟\", \" \", \"只\", \"益\", \"宪\", \"呦\", \"葛\", \"鸽\", \"、\", \"侧\", \"氮\", \"她\", \"料\", \"饱\", \"雕\", \"K\", \"埃\", \"噬\", \"便\", \"%\", \"冉\", \"咸\", \"死\", \"?\", \"卜\", \"涡\", \"陛\", \"称\", \"剑\", \"瓷\", \"粼\", \"缉\", \"吕\", \"绅\", \"竣\", \"秀\", \"洞\", \"肥\", \"诈\", \"址\", \"销\", \"扩\", \"潦\", \"沥\", \"团\", \"坠\", \"刮\", \"失\", \"湿\", \"谊\", \"夫\", \"谦\", \"离\", \"钻\", \"莫\", \"萼\", \"烂\", \"攥\", \"司\", \"港\", \"佘\", \"恶\", \"革\", \"撰\", \"荡\", \"吩\", \"兑\", \"烈\", \"聊\", \"买\", \"踹\", \"秦\", \"讥\", \"驿\", \"蔼\", \"用\", \"疗\", \"场\", \"研\", \"弥\", \"循\", \"惴\", \"屋\", \"寰\", \"咎\", \"n\", \"疹\", \"放\", \"拾\", \"唉\", \"撬\", \"闫\", \"惶\", \"^\", \"税\", \"睑\", \"竖\", \"擘\", \"„\", \"侵\", \"郁\", \"蝌\", \"泛\", \"口\", \"─\", \"荟\", \"撷\", \"投\", \"惊\", \"勒\", \"钢\", \"腹\", \"0\", \"姊\", \"写\", \"备\", \"芭\", \"別\", \"娇\", \"肓\", \"档\", \"绚\", \"耿\", \"瑶\", \"虎\", \"缆\", \"茉\", \"勾\", \"标\", \"帮\", \"霏\", \"拣\", \"卖\", \"麾\", \"像\", \"覆\", \"搞\", \"仅\", \"从\", \"弹\", \"炫\", \"伪\", \"楠\", \"艾\", \"泸\", \"浮\", \"豁\", \"l\", \"猖\", \"z\", \"眠\", \"乡\", \"宝\", \"脱\", \"旷\", \"嫖\", \"智\", \"肃\", \"订\", \"倦\", \"h\", \"內\", \"财\", \"洲\", \"鳃\", \"薛\", \"主\", \"纱\", \"喘\", \"庸\", \"咋\", \"透\", \"旅\", \"撑\", \"穗\", \"币\", \"绒\", \"嗔\", \"赘\", \"黏\", \"娃\", \"吮\", \"间\", \"葡\", \"斌\", \"积\", \"姗\", \"膀\", \"吞\", \"器\", \"坪\", \"啊\", \"坎\", \"帅\", \"评\", \"恼\", \"贼\", \"偌\", \"埂\", \"胜\", \"祛\", \"膜\", \"强\", \"卸\", \"唇\", \"涟\", \"罄\", \"分\", \"走\", \"妨\", \"螺\", \"咕\", \"铂\", \"示\", \"韦\", \"老\", \"蛔\", \"幕\", \"诸\", \"摧\", \"邃\", \"衣\", \"瑨\", \"跟\", \"陀\", \"肺\", \"邋\", \"铤\", \"邕\", \"野\", \"炅\", \"无\", \"莎\", \"扑\", \"嘉\", \"瞟\", \"构\", \"纲\", \"癫\", \"痫\", \"馋\", \"馕\", \"上\", \"赐\", \"丰\", \"谋\", \"岸\", \"據\", \"袒\", \"谐\", \"乔\", \"驰\", \"匪\", \"其\", \"铨\", \"魔\", \"络\", \"顽\", \"问\", \"难\", \"钮\", \"毛\", \"呵\", \"南\", \"肴\", \"矮\", \"蟋\", \"湾\", \"岱\", \"龙\", \"楞\", \"氛\", \"控\", \"旋\", \"万\", \"厮\", \"腿\", \"医\", \"硬\", \"醒\", \"禁\", \"炮\", \"耻\", \"曦\", \"兔\", \"鞠\", \"肯\", \"摹\", \"涵\", \"维\", \"衷\", \"翕\", \"猝\", \"翅\", \"犁\", \"现\", \"治\", \"焰\", \"沾\", \"悬\", \"框\", \"乒\", \"\\u0005\", \"粕\", \"公\", \"氢\", \"伤\", \"胰\", \"继\", \"陋\", \"够\", \"签\", \"林\", \"睹\", \"韫\", \"斐\", \"呕\", \"阻\", \"遑\", \"歪\", \"芬\", \"瞩\", \"赂\", \"谆\", \"歼\", \"厉\", \"披\", \"筋\", \"演\", \"思\", \"拿\", \"审\", \"鹭\", \"(\", \"桑\", \"霍\", \"觅\", \"伙\", \"盘\", \"踌\", \"静\", \"奎\", \"舔\", \"奔\", \"嗦\", \"~\", \"瑞\", \"濮\", \"汁\", \"祖\", \"份\", \"疯\", \"匕\", \"敞\", \"广\", \"ê\", \"亦\", \"呻\", \"旱\", \"璇\", \"习\", \"倜\", \"禽\", \"喀\", \"琉\", \"努\", \"咔\", \"簧\", \"汇\", \"嗡\", \"缺\", \"荐\", \"初\", \"吨\", \"债\", \"兜\", \"竿\", \"跑\", \"惦\", \"皆\", \"嬉\", \"呷\", \"柿\", \"工\", \"圣\", \"阎\", \"漆\", \"都\", \"旎\", \"阐\", \"妙\", \"根\", \"厕\", \"骨\", \"告\", \"贷\", \"拼\", \"群\", \"妮\", \"纂\", \"坤\", \"衰\", \"美\", \"褂\", \"s\", \"见\", \"缮\", \"汩\", \"翻\", \"店\", \"悦\", \"析\", \"什\", \"澄\", \"聆\", \"窄\", \"摄\", \"御\", \"咐\", \"瘤\", \"薪\", \"赖\", \"割\", \"擎\", \"求\", \"娜\", \"坞\", \"碑\", \"某\", \"驱\", \"蛋\", \"步\", \"京\", \"渲\", \"介\", \"淅\", \"欲\", \"钟\", \"桌\", \"乃\", \"民\", \"芦\", \"皇\", \"猥\", \"搀\", \"掉\", \"笋\", \"画\", \"荤\", \"儿\", \"瘫\", \"绥\", \"须\", \"铁\", \"吻\", \"稍\", \"圳\", \"哀\", \"宫\", \"锅\", \"朱\", \"悴\", \"齿\", \"酋\", \"鹈\", \"靴\", \"苹\", \"绸\", \"脉\", \"遂\", \"跚\", \"果\", \"棉\", \"凛\", \"灵\", \"壑\", \"舛\", \"苗\", \"丑\", \"吴\", \"论\", \"算\", \"胡\", \"骂\", \"挟\", \"劑\", \"窖\", \"默\", \"胆\", \"黎\", \";\", \"抹\", \"胥\", \"饿\", \"盼\", \"罕\", \"⑷\", \"荷\", \"设\", \"溪\", \"抽\", \"措\", \"希\", \"骛\", \"廉\", \"估\", \"榷\", \"族\", \"操\", \"滕\", \"避\", \"署\", \"茶\", \"羚\", \"盯\", \"久\", \"岗\", \"兵\", \"滨\", \"骗\", \"锻\", \"跳\", \"迫\", \"尧\", \"元\", \"魂\", \"哗\", \"色\", \"蓟\", \"复\", \"首\", \"愣\", \"代\", \"引\", \"淄\", \"亟\", \"掰\", \"恕\", \"喊\", \"狰\", \"瞬\", \"擀\", \"簿\", \"坯\", \"憾\", \"他\", \"炙\", \"邪\", \"拭\", \"硕\", \"谔\", \"袋\", \"瑒\", \"非\", \"怒\", \"释\", \"突\", \"痴\", \"璜\", \"岩\", \"缀\", \"恩\", \"馁\", \"闪\", \"篮\", \"摇\", \"啐\", \"蒸\", \"市\", \"账\", \"盎\", \"镜\", \"吧\", \"敲\", \"乖\", \"胱\", \"睁\", \"堆\", \"灌\", \"湖\", \"酥\", \"登\", \"瑟\", \"究\", \"拇\", \"瞄\", \"胃\", \"官\", \"A\", \"韵\", \"俪\", \"瓶\", \"桦\", \"哨\", \"视\", \"录\", \"a\", \"鲸\", \"探\", \"斤\", \"呈\", \"恪\", \"村\", \"壶\", \"佐\", \"纸\", \"崇\", \"仑\", \"灭\", \"也\", \"勤\", \"耐\", \"酿\", \"蝇\", \"杠\", \"▪\", \"忘\", \"映\", \"轰\", \"陇\", \"鑫\", \"尺\", \"发\", \"履\", \"颜\", \"宴\", \"役\", \"办\", \"痹\", \"蕾\", \"淀\", \"并\", \"・\", \"诨\", \"橙\", \"玩\", \"胀\", \"册\", \"里\", \"聂\", \"枕\", \"霸\", \"志\", \"弑\", \"妄\", \"g\", \"迩\", \"绉\", \"窦\", \"国\", \"责\", \"咯\", \"逾\", \"判\", \"梭\", \"葱\", \"慑\", \"盖\", \"绎\", \"今\", \"颌\", \"冻\", \"唱\", \"瀚\", \"任\", \"曝\", \"禅\", \"既\", \"愁\", \"哼\", \"娥\", \"瞅\", \"慢\", \"杀\", \"r\", \"双\", \"升\", \"渔\", \"可\", \"痪\", \"郎\", \"烧\", \"磅\", \"没\", \"抗\", \"魁\", \"愈\", \"亨\", \"春\", \"耕\", \"巷\", \"诧\", \"烙\", \"栽\", \"崖\", \"韪\", \"盒\", \"6\", \"蛛\", \"迦\", \"碴\", \"噶\", \"簇\", \"彼\", \"褐\", \"搭\", \"夯\", \"砂\", \"珉\", \"烟\", \"践\", \"般\", \"动\", \"拟\", \"攫\", \"鼠\", \"惹\", \"命\", \"淤\", \"粟\", \"伊\", \"一\", \"拥\", \"风\", \"招\", \"种\", \":\", \"衔\", \"鱼\", \"盟\", \"皮\", \"琼\", \"做\", \"靠\", \"流\", \"泳\", \"前\", \"!\", \"衫\", \"粤\", \"最\", \"u\", \"毡\", \"蹩\", \"。\", \"柴\", \"煞\", \"暗\", \"捷\", \"奈\", \"筒\", \"欸\", \"脯\", \"孩\", \"敢\", \"跌\", \"翩\", \"棵\", \"阳\", \"吾\", \"旭\", \"很\", \"汹\", \"子\", \"渍\", \"焯\", \"提\", \"块\", \"帝\", \"洛\", \"专\", \"山\", \"修\", \"枉\", \"氨\", \"们\", \"枚\", \"裕\", \"程\", \"二\", \"耀\", \"抨\", \"厂\", \"素\", \"愧\", \"番\", \"瘙\", \"又\", \"迭\", \"股\", \"沙\", \"蛮\", \"略\", \"返\", \"倘\", \"吭\", \"篝\", \"央\", \"恰\", \"笃\", \"拗\", \"睡\", \"玉\", \"护\", \"及\", \"缩\", \"秸\", \"批\", \"费\", \"岳\", \"宅\", \"额\", \"剐\", \"乳\", \"徒\", \"俊\", \"后\", \"肢\", \"挎\", \"缔\", \"鳞\", \"谎\", \"矍\", \"钞\", \"逛\", \"接\", \"卑\", \"杜\", \"落\", \"抿\", \"⑤\", \"忌\", \"你\", \"俞\", \"肖\", \"峰\", \"以\", \"末\", \"暨\", \"卻\", \"宸\", \"狱\", \"传\", \"望\", \"霜\", \"涅\", \"焚\", \"虚\", \"鄂\", \"道\", \"»\", \"冶\", \"蓁\", \"祢\", \"连\", \"寡\", \"宠\", \"饲\", \"跤\", \"琢\", \"捺\", \"挲\", \"薇\", \"锣\", \"赅\", \"庄\", \"贿\", \"當\", \"碟\", \"掂\", \"匹\", \"站\", \"翱\", \"籍\", \"赋\", \"泥\", \"胞\", \"常\", \"三\", \"篡\", \"缠\", \"癌\", \"安\", \"黩\", \"颂\", \"吹\", \"礼\", \"臧\", \"骁\", \"折\", \"篇\", \"\", \"吉\", \"花\", \"货\", \"掷\", \"窝\", \"窜\", \"仗\", \"搏\", \"土\", \"摆\", \"裤\"]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/ar": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/de": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"u\", \"̈\"]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/en": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-1.8B @ cc100/es": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-1.8B @ cc100/fa": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/fr": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/ja": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 463,
"oov_ratio": 0.000767744770464212,
"_oov_charset": "[\"へ\", \"コ\", \"て\", \"゙\", \"し\", \"た\", \"か\", \"は\", \"フ\", \"つ\", \"ス\", \"ホ\", \"く\", \"す\", \"ト\", \"ふ\", \"せ\", \"ヒ\", \"シ\", \"と\", \"ハ\", \"゚\", \"ひ\"]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/ko": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"金\", \"立\", \"理\", \"龍\", \"良\", \"梁\", \"陸\", \"樂\", \"靈\", \"女\", \"識\", \"樂\", \"流\", \"累\", \"不\"]",
"reversible": false
},
"Qwen/Qwen1.5-1.8B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-1.8B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-110B @ cc100/ar": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/de": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"u\", \"̈\"]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/en": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-110B @ cc100/es": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-110B @ cc100/fa": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/fr": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/ja": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 463,
"oov_ratio": 0.000767744770464212,
"_oov_charset": "[\"へ\", \"コ\", \"て\", \"゙\", \"し\", \"た\", \"か\", \"は\", \"フ\", \"つ\", \"ス\", \"ホ\", \"く\", \"す\", \"ト\", \"ふ\", \"せ\", \"ヒ\", \"シ\", \"と\", \"ハ\", \"゚\", \"ひ\"]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/ko": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"金\", \"立\", \"理\", \"龍\", \"良\", \"梁\", \"陸\", \"樂\", \"靈\", \"女\", \"識\", \"樂\", \"流\", \"累\", \"不\"]",
"reversible": false
},
"Qwen/Qwen1.5-110B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-110B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B @ cc100/ar": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2813283,
"_n_tokens": 614959,
"_n_chars": 1560987,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/de": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1814876,
"_n_tokens": 503561,
"_n_chars": 1784021,
"_n_oov_chars": 27,
"oov_ratio": 1.5134350996989385e-05,
"_oov_charset": "[\"u\", \"̈\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/en": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1124813,
"_n_tokens": 257983,
"_n_chars": 1121360,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B @ cc100/es": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1664455,
"_n_tokens": 434264,
"_n_chars": 1630297,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
},
"Qwen/Qwen1.5-14B @ cc100/fa": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2054052,
"_n_tokens": 643421,
"_n_chars": 1145876,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/fr": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1540504,
"_n_tokens": 413637,
"_n_chars": 1484970,
"_n_oov_chars": 31,
"oov_ratio": 2.087584260961501e-05,
"_oov_charset": "[\"̂\", \"́\", \"̧\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/ja": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1774770,
"_n_tokens": 377144,
"_n_chars": 603065,
"_n_oov_chars": 463,
"oov_ratio": 0.000767744770464212,
"_oov_charset": "[\"へ\", \"コ\", \"て\", \"゙\", \"し\", \"た\", \"か\", \"は\", \"フ\", \"つ\", \"ス\", \"ホ\", \"く\", \"す\", \"ト\", \"ふ\", \"せ\", \"ヒ\", \"シ\", \"と\", \"ハ\", \"゚\", \"ひ\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/ko": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 1524839,
"_n_tokens": 457492,
"_n_chars": 655190,
"_n_oov_chars": 25,
"oov_ratio": 3.815687052610693e-05,
"_oov_charset": "[\"金\", \"立\", \"理\", \"龍\", \"良\", \"梁\", \"陸\", \"樂\", \"靈\", \"女\", \"識\", \"樂\", \"流\", \"累\", \"不\"]",
"reversible": false
},
"Qwen/Qwen1.5-14B @ cc100/zh-Hans": {
"tokenizer": "Qwen1.5-14B",
"organization": "Alibaba",
"vocab_size": 151646,
"_n_bytes": 2633047,
"_n_tokens": 589211,
"_n_chars": 927311,
"_n_oov_chars": 0,
"oov_ratio": 0.0,
"_oov_charset": "[]",
"reversible": true
}
}