murat's picture
Upload vocab.json with huggingface_hub
207605d verified
{
"char_to_idx": {
"<PAD>": 0,
"<UNK>": 1,
"<BOS>": 2,
"<EOS>": 3,
"д": 4,
"а": 5,
"г": 6,
"ы": 7,
" ": 8,
"б": 9,
"и": 10,
"р": 11,
"ж": 12,
"о": 13,
"л": 14,
"у": 15,
"й": 16,
"т": 17,
"м": 18,
",": 19,
"к": 20,
"с": 21,
"н": 22,
"ч": 23,
"ө": 24,
"з": 25,
"ү": 26,
"э": 27,
"е": 28,
".": 29,
"я": 30,
"п": 31,
"ш": 32,
"4": 33,
"0": 34,
"ц": 35,
"ң": 36,
"«": 37,
"»": 38,
"!": 39,
"в": 40,
"2": 41,
"-": 42,
"х": 43,
"ф": 44,
"k": 45,
"l": 46,
"o": 47,
"p": 48,
"g": 49,
"ю": 50,
"—": 51,
"7": 52,
"5": 53,
"1": 54,
"ь": 55,
"6": 56,
"i": 57,
"s": 58,
"a": 59,
" ": 60,
"t": 61,
"e": 62,
"m": 63,
"r": 64,
"v": 65,
"’": 66,
"9": 67,
"%": 68,
"3": 69,
"?": 70,
":": 71,
"]": 72,
"[": 73,
"…": 74,
"8": 75,
"x": 76,
"(": 77,
")": 78,
"№": 79,
";": 80,
"–": 81,
"“": 82,
"”": 83,
"u": 84,
"​": 85,
"c": 86,
"•": 87,
"b": 88,
"f": 89,
"w": 90,
"ё": 91,
"n": 92,
"y": 93,
"d": 94,
"h": 95,
"―": 96,
"/": 97,
"*": 98,
"$": 99,
"ъ": 100,
"\"": 101,
"{": 102,
"}": 103,
"z": 104,
"щ": 105,
"q": 106,
"'": 107,
"@": 108,
"ɵ": 109,
"&": 110,
"ӊ": 111,
"j": 112,
"+": 113,
"ç": 114,
"ı": 115,
"ö": 116,
"ü": 117,
"ѳ": 118,
"─": 119,
"²": 120,
"‌": 121,
"ş": 122,
"‘": 123,
"‑": 124,
"_": 125,
"·": 126,
"#": 127,
"⅛": 128,
" ": 129,
"=": 130,
"ꞌ": 131,
"⅔": 132,
"⁠": 133,
"❤": 134,
"️": 135,
"є": 136,
"″": 137,
"ʙ": 138,
" ": 139,
"🙏": 140,
"̆": 141,
"☮": 142,
"¶": 143,
"қ": 144,
"ұ": 145,
"😊": 146,
"🙂": 147,
"‣": 148,
"і": 149,
"⅓": 150,
"\\": 151,
"≠": 152,
"➖": 153,
"é": 154,
"‒": 155,
"ä": 156,
"à": 157,
"⠀": 158,
"🇰": 159,
"🇬": 160,
"θ": 161,
"ʃ": 162,
"č": 163,
"á": 164,
"🎇": 165,
"🌅": 166,
"×": 167,
"‚": 168,
"°": 169,
"ě": 170,
"`": 171,
"ə": 172,
"ƣ": 173,
"„": 174
},
"idx_to_char": {
"0": "<PAD>",
"1": "<UNK>",
"2": "<BOS>",
"3": "<EOS>",
"4": "д",
"5": "а",
"6": "г",
"7": "ы",
"8": " ",
"9": "б",
"10": "и",
"11": "р",
"12": "ж",
"13": "о",
"14": "л",
"15": "у",
"16": "й",
"17": "т",
"18": "м",
"19": ",",
"20": "к",
"21": "с",
"22": "н",
"23": "ч",
"24": "ө",
"25": "з",
"26": "ү",
"27": "э",
"28": "е",
"29": ".",
"30": "я",
"31": "п",
"32": "ш",
"33": "4",
"34": "0",
"35": "ц",
"36": "ң",
"37": "«",
"38": "»",
"39": "!",
"40": "в",
"41": "2",
"42": "-",
"43": "х",
"44": "ф",
"45": "k",
"46": "l",
"47": "o",
"48": "p",
"49": "g",
"50": "ю",
"51": "—",
"52": "7",
"53": "5",
"54": "1",
"55": "ь",
"56": "6",
"57": "i",
"58": "s",
"59": "a",
"60": " ",
"61": "t",
"62": "e",
"63": "m",
"64": "r",
"65": "v",
"66": "’",
"67": "9",
"68": "%",
"69": "3",
"70": "?",
"71": ":",
"72": "]",
"73": "[",
"74": "…",
"75": "8",
"76": "x",
"77": "(",
"78": ")",
"79": "№",
"80": ";",
"81": "–",
"82": "“",
"83": "”",
"84": "u",
"85": "​",
"86": "c",
"87": "•",
"88": "b",
"89": "f",
"90": "w",
"91": "ё",
"92": "n",
"93": "y",
"94": "d",
"95": "h",
"96": "―",
"97": "/",
"98": "*",
"99": "$",
"100": "ъ",
"101": "\"",
"102": "{",
"103": "}",
"104": "z",
"105": "щ",
"106": "q",
"107": "'",
"108": "@",
"109": "ɵ",
"110": "&",
"111": "ӊ",
"112": "j",
"113": "+",
"114": "ç",
"115": "ı",
"116": "ö",
"117": "ü",
"118": "ѳ",
"119": "─",
"120": "²",
"121": "‌",
"122": "ş",
"123": "‘",
"124": "‑",
"125": "_",
"126": "·",
"127": "#",
"128": "⅛",
"129": " ",
"130": "=",
"131": "ꞌ",
"132": "⅔",
"133": "⁠",
"134": "❤",
"135": "️",
"136": "є",
"137": "″",
"138": "ʙ",
"139": " ",
"140": "🙏",
"141": "̆",
"142": "☮",
"143": "¶",
"144": "қ",
"145": "ұ",
"146": "😊",
"147": "🙂",
"148": "‣",
"149": "і",
"150": "⅓",
"151": "\\",
"152": "≠",
"153": "➖",
"154": "é",
"155": "‒",
"156": "ä",
"157": "à",
"158": "⠀",
"159": "🇰",
"160": "🇬",
"161": "θ",
"162": "ʃ",
"163": "č",
"164": "á",
"165": "🎇",
"166": "🌅",
"167": "×",
"168": "‚",
"169": "°",
"170": "ě",
"171": "`",
"172": "ə",
"173": "ƣ",
"174": "„"
}
}