specieslm-metazoa-upstream-k6 / special_tokens_map.json
Johannes
speciesLM k6, metazoa, upstream
690bf20
raw
history blame
15.3 kB
{
"additional_special_tokens": [
"acanthaster_planci_gca001949145v1",
"acanthochromis_polyacanthus",
"accipiter_nisus",
"acromyrmex_echinatior_gca000204515v1rs",
"acropora_millepora_gca013753865v1",
"actinia_equina_gca011057435",
"actinia_tenebrosa_gca009602425v1",
"acyrthosiphon_pisum",
"adineta_vaga",
"aedes_aegypti_lvpagwg",
"aedes_albopictus",
"agrilus_planipennis_gca000699045v2",
"ailuropoda_melanoleuca",
"amazona_collaria",
"amphibalanus_amphitrite_gca019059575v1",
"amphilophus_citrinellus",
"amphimedon_queenslandica",
"amphiprion_ocellaris",
"amphiprion_percula",
"amyelois_transitella_gca001186105v1rs",
"anabas_testudineus",
"anas_platyrhynchos",
"anas_zonorhyncha",
"anneissia_japonica_gca011630105v1",
"anolis_carolinensis",
"anopheles_albimanus",
"anopheles_arabiensis",
"anopheles_atroparvus_gca914969975",
"anopheles_christyi",
"anopheles_coluzzii_ngousso",
"anopheles_culicifacies",
"anopheles_darlingi",
"anopheles_dirus",
"anopheles_epiroticus",
"anopheles_farauti",
"anopheles_funestus",
"anopheles_gambiae",
"anopheles_maculatus",
"anopheles_melas",
"anopheles_merus",
"anopheles_minimus",
"anopheles_quadriannulatus",
"anopheles_sinensis_china",
"anopheles_stephensi",
"anoplophora_glabripennis",
"anser_brachyrhynchus",
"anser_cygnoides",
"anthonomus_grandis_gca022605725v3rs",
"aotus_nancymaae",
"aphidius_gifuensis_gca014905175v1",
"apis_dorsata_gca000469605v1rs",
"apis_florea_gca000184785v2rs",
"apis_mellifera",
"aplysia_californica_gca000002075v2",
"apteryx_haastii",
"apteryx_owenii",
"apteryx_rowi",
"aquila_chrysaetos_chrysaetos",
"ascaris_suum",
"astatotilapia_calliptera",
"asterias_rubens_gca902459465v3",
"astyanax_mexicanus",
"athalia_rosae_gca917208135v1",
"athene_cunicularia",
"atta_cephalotes",
"bactrocera_dorsalis_gca000789215v2",
"bactrocera_latifrons_gca001853355v1",
"bactrocera_tryoni_gca016617805v2",
"balaenoptera_musculus",
"belgica_antarctica",
"bemisia_tabaci_ssa3nig",
"betta_splendens",
"bicyclus_anynana_gca900239965v1rs",
"biomphalaria_glabrata",
"bison_bison_bison",
"bombus_impatiens",
"bombus_terrestris_gca910591885v2",
"bombyx_mandarina_gca003987935v1rs",
"bombyx_mori",
"bos_grunniens",
"bos_indicus_hybrid",
"bos_mutus",
"bos_taurus_hybrid",
"branchiostoma_lanceolatum",
"brugia_malayi",
"bubo_bubo",
"buteo_japonicus",
"caenorhabditis_brenneri",
"caenorhabditis_briggsae",
"caenorhabditis_elegans",
"caenorhabditis_japonica",
"caenorhabditis_remanei",
"cairina_moschata_domestica",
"calidris_pugnax",
"calidris_pygmaea",
"callithrix_jacchus",
"callorhinchus_milii",
"camarhynchus_parvulus",
"camelus_dromedarius",
"camponotus_floridanus_gca003227725v1rs",
"canis_lupus_familiarisgsd",
"capitella_teleta",
"capra_hircus",
"carassius_auratus",
"carlito_syrichta",
"castor_canadensis",
"catagonus_wagneri",
"catharus_ustulatus",
"cavia_aperea",
"cavia_porcellus",
"cebus_imitator",
"centruroides_sculpturatus_gca000671375v2",
"ceratitis_capitata_gca000347755v4",
"cercocebus_atys",
"cervus_hanglu_yarkandensis",
"chelonoidis_abingdonii",
"chelonus_insularis_gca013357705v1rs",
"chelydra_serpentina",
"chinchilla_lanigera",
"chlorocebus_sabaeus",
"choloepus_hoffmanni",
"chrysemys_picta_bellii",
"chrysolophus_pictus",
"cimex_lectularius",
"ciona_intestinalis",
"ciona_savignyi",
"clupea_harengus",
"clytia_hemisphaerica_gca902728285",
"colobus_angolensis_palliatus",
"copidosoma_floridanum_gca000648655v2",
"corvus_moneduloides",
"cotesia_glomerata_gca020080835v1",
"cottoperca_gobio",
"coturnix_japonica",
"crassostrea_gigas",
"crassostrea_virginica_gca002022765v4",
"cricetulus_griseus_picr",
"crocodylus_porosus",
"culex_quinquefasciatus_gca015732765v1",
"culicoides_sonorensis",
"cyanistes_caeruleus",
"cyclopterus_lumpus",
"cynoglossus_semilaevis",
"cyprinodon_variegatus",
"cyprinus_carpio_carpio",
"danaus_plexippus",
"danio_rerio",
"daphnia_magna_gca020631705v2",
"daphnia_pulex",
"daphnia_pulicaria_gca021234035v2rs",
"dasypus_novemcinctus",
"delphinapterus_leucas",
"dendroctonus_ponderosae_gca000355655v1",
"dendronephthya_gigantea_gca004324835v1",
"denticeps_clupeoides",
"dermacentor_andersoni_gca023375885v2rs",
"dermacentor_silvarum_gca013339745v1",
"dermatophagoides_pteronyssinus_gca001901225v2",
"diabrotica_virgifera_gca917563875v2rs",
"dicentrarchus_labrax",
"dimorphilus_gyrociliatus_gca904063045v1",
"dinothrombium_tinctorium",
"dipodomys_ordii",
"diuraphis_noxia_gca001186385v1",
"dromaius_novaehollandiae",
"drosophila_ananassae",
"drosophila_erecta",
"drosophila_grimshawi",
"drosophila_melanogaster",
"drosophila_mojavensis",
"drosophila_persimilis",
"drosophila_pseudoobscura",
"drosophila_sechellia",
"drosophila_simulans",
"drosophila_virilis",
"drosophila_willistoni",
"drosophila_yakuba",
"dufourea_novaeangliae_gca001272555v1rs",
"echeneis_naucrates",
"echinococcus_granulosus_gca000524195v1rs",
"echinops_telfairi",
"electrophorus_electricus",
"eptatretus_burgeri",
"equus_asinus",
"equus_caballus",
"erinaceus_europaeus",
"erpetoichthys_calabaricus",
"erythrura_gouldiae",
"esox_lucius",
"eufriesea_mexicana_gca001483705v1rs",
"eurytemora_affinis_gca000591075v2",
"exaiptasia_diaphana_gca001417965v1",
"falco_tinnunculus",
"felis_catus",
"ficedula_albicollis",
"folsomia_candida",
"fukomys_damarensis",
"fundulus_heteroclitus",
"gadus_morhua",
"galendromus_occidentalis_gca000255335v2rs",
"galleria_mellonella_gca003640425v2rs",
"gallus_gallus_gca000002315v5",
"gambusia_affinis",
"gasterosteus_aculeatus",
"geospiza_fortis",
"gigantopelta_aegis_gca016097555v1",
"glossina_austeni",
"glossina_brevipalpis",
"glossina_fuscipes",
"glossina_morsitans",
"glossina_pallidipes",
"glossina_palpalis",
"gopherus_agassizii",
"gopherus_evgoodei",
"gorilla_gorilla",
"gouania_willdenowi",
"habropoda_laboriosa_gca001263275v1rs",
"haemaphysalis_longicornis_gca013339765v1",
"haliotis_rubra_gca003918875v1rs",
"haliotis_rufescens_gca023055435v1rs",
"haplochromis_burtoni",
"harpegnathos_saltator_gca003227715v2rs",
"heliconius_melpomene",
"helicoverpa_armigera_gca023701775v1rs",
"helicoverpa_zea_gca022581195v1rs",
"helobdella_robusta",
"hermetia_illucens_gca905115235v1",
"heterocephalus_glaber_male",
"hippocampus_comes",
"hofstenia_miamia",
"homalodisca_vitripennis_gca021130785v2rs",
"homarus_americanus_gca018991925v1",
"homo_sapiens",
"hucho_hucho",
"hyalella_azteca_gca000764305v2",
"hyalomma_asiaticum_gca013339685v1",
"hydra_vulgaris_gca022113875v1rs",
"hymenolepis_microstoma",
"hypsibius_exemplaris_gca002082055v1",
"ictalurus_punctatus",
"ictidomys_tridecemlineatus",
"ixodes_persulcatus_gca013358835v1",
"ixodes_scapularis_gca016920785v2",
"jaculus_jaculus",
"junco_hyemalis",
"kryptolebias_marmoratus",
"labrus_bergylta",
"larimichthys_crocea",
"lates_calcarifer",
"laticauda_laticaudata",
"latimeria_chalumnae",
"leguminivora_glycinivorella_gca023078275v1rs",
"lepeophtheirus_salmonis_gca016086655v3rs",
"lepidothrix_coronata",
"lepisosteus_oculatus",
"leptinotarsa_decemlineata_gca000500325v2",
"leptobrachium_leishanense",
"leptotrombidium_deliense",
"limulus_polyphemus_gca000517525v1",
"linepithema_humile_gca000217595v1rs",
"lingula_anatina",
"loa_loa",
"lonchura_striata_domestica",
"lottia_gigantea",
"loxodonta_africana",
"lucilia_cuprina_gca022045245v1rs",
"lutzomyia_longipalpis",
"lynx_canadensis",
"lytechinus_variegatus_gca018143015v1",
"macaca_fascicularis",
"macaca_mulatta",
"macaca_nemestrina",
"malurus_cyaneus_samueli",
"manacus_vitellinus",
"mandrillus_leucophaeus",
"manduca_sexta_gca014839805v1rs",
"marmota_marmota_marmota",
"mastacembelus_armatus",
"mayetiola_destructor",
"maylandia_zebra",
"megachile_rotundata_gca000220905v1rs",
"megaselia_scalaris",
"meleagris_gallopavo",
"melitaea_cinxia_gca905220565v1",
"melopsittacus_undulatus",
"mercenaria_mercenaria_gca014805675v2",
"meriones_unguiculatus",
"mesocricetus_auratus",
"microcebus_murinus",
"microtus_ochrogaster",
"mizuhopecten_yessoensis_gca002113885v2",
"mnemiopsis_leidyi",
"mola_mola",
"monodelphis_domestica",
"monodon_monoceros",
"monomorium_pharaonis_gca013373865v2",
"monopterus_albus",
"moschus_moschiferus",
"mus_caroli",
"mus_musculus",
"mus_pahari",
"mus_spicilegus",
"mus_spretus",
"musca_domestica",
"mustela_putorius_furo",
"myotis_lucifugus",
"myripristis_murdjan",
"naja_naja",
"nannospalax_galili",
"nasonia_vitripennis",
"necator_americanus",
"nematostella_vectensis",
"neodiprion_lecontei_gca021901455v1rs",
"neodiprion_pinetum_gca021155775v1rs",
"neogobius_melanostomus",
"neolamprologus_brichardi",
"neovison_vison",
"nilaparvata_lugens_gca014356525v1rs",
"nomascus_leucogenys",
"notamacropus_eugenii",
"notechis_scutatus",
"nothobranchius_furzeri",
"nothoprocta_perdicaria",
"numida_meleagris",
"ochotona_princeps",
"octodon_degus",
"octopus_bimaculoides",
"octopus_sinensis_gca006345805v1",
"onchocerca_volvulus",
"oncorhynchus_kisutch",
"oncorhynchus_mykiss",
"oncorhynchus_tshawytscha",
"onthophagus_taurus_gca000648695v2",
"ooceraea_biroi_gca003672135v1",
"orbicella_faveolata_gca002042975v1",
"orchesella_cincta",
"oreochromis_aureus",
"oreochromis_niloticus",
"ornithorhynchus_anatinus",
"orussus_abietinus_gca000612105v2",
"oryctolagus_cuniculus",
"oryzias_javanicus",
"oryzias_latipes",
"oryzias_melastigma",
"oryzias_sinensis",
"otolemur_garnettii",
"otus_sunia",
"ovis_aries_rambouillet",
"owenia_fusiformis_gca903813345v1",
"pan_paniscus",
"pan_troglodytes",
"panthera_leo",
"panthera_pardus",
"panthera_tigris_altaica",
"papio_anubis",
"parambassis_ranga",
"paramormyrops_kingsleyae",
"parasteatoda_tepidariorum_gca000365465v3",
"parus_major",
"patiria_miniata_gca015706575v1",
"pavo_cristatus",
"pectinophora_gossypiella_gca024362695v1rs",
"pediculus_humanus",
"pelodiscus_sinensis",
"pelusios_castaneus",
"penaeus_chinensis_gca019202785v2rs",
"penaeus_japonicus_gca017312705v1",
"penaeus_monodon_gca015228065v1",
"penaeus_vannamei_gca003789085v1",
"periophthalmus_magnuspinnatus",
"peromyscus_maniculatus_bairdii",
"petromyzon_marinus",
"phascolarctos_cinereus",
"phasianus_colchicus",
"phlebotomus_papatasi",
"phlebotomus_perniciosus_gca918844115v2",
"phocoena_sinus",
"physeter_catodon",
"piliocolobus_tephrosceles",
"pocillopora_damicornis_gca003704095v1",
"podarcis_muralis",
"poecilia_formosa",
"poecilia_latipinna",
"poecilia_mexicana",
"poecilia_reticulata",
"pogona_vitticeps",
"pogonomyrmex_barbatus_gca000187915v1rs",
"polistes_canadensis_gca001313835v1rs",
"polistes_dominula_gca001465965v1rs",
"polistes_fuscatus_gca010416935v1rs",
"pollicipes_pollicipes_gca011947565v2",
"pomacea_canaliculata_gca003073045v1",
"pomphorhynchus_laevis_gca012934845v2gb",
"pongo_abelii",
"portunus_trituberculatus_gca017591435v1",
"priapulus_caudatus_gca000485595v2",
"pristionchus_pacificus",
"procambarus_clarkii_gca020424385v2",
"procavia_capensis",
"prolemur_simus",
"propithecus_coquereli",
"pseudonaja_textilis",
"pteropus_vampyrus",
"pundamilia_nyererei",
"pygocentrus_nattereri",
"rattus_norvegicus_wkybbb",
"rhagoletis_pomonella_gca013731165v1",
"rhinolophus_ferrumequinum",
"rhinopithecus_bieti",
"rhinopithecus_roxellana",
"rhipicephalus_microplus_gca013339725v1",
"rhipicephalus_sanguineus_gca013339695v1",
"rhodnius_prolixus",
"rhopalosiphum_maidis_gca003676215v3",
"saccharomyces_cerevisiae",
"saccoglossus_kowalevskii_gca000003605v1",
"saimiri_boliviensis_boliviensis",
"salarias_fasciatus",
"salmo_salar",
"salmo_trutta",
"salvator_merianae",
"sander_lucioperca",
"sarcophilus_harrisii",
"sarcoptes_scabiei",
"schistocerca_americana_gca021461395v2rs",
"schistosoma_haematobium_gca000699445v2rs",
"schistosoma_mansoni",
"sciurus_vulgaris",
"scleropages_formosus",
"scophthalmus_maximus",
"serinus_canaria",
"seriola_dumerili",
"seriola_lalandi_dorsalis",
"sinocyclocheilus_anshuiensis",
"sinocyclocheilus_grahami",
"sinocyclocheilus_rhinocerous",
"sipha_flava_gca003268045v1",
"sitophilus_oryzae_gca002938485v2rs",
"solenopsis_invicta",
"sorex_araneus",
"sparus_aurata",
"spermophilus_dauricus",
"sphaeramia_orbicularis",
"sphenodon_punctatus",
"stachyris_ruficeps",
"stegastes_partitus",
"stegodyphus_dumicola_gca010614865v2rs",
"stegodyphus_mimosarum",
"stomoxys_calcitrans",
"strigamia_maritima",
"strigops_habroptila",
"strix_occidentalis_caurina",
"strongylocentrotus_purpuratus",
"strongyloides_ratti",
"struthio_camelus_australis",
"stylophora_pistillata_gca002571385v1",
"suricata_suricatta",
"sus_scrofa_usmarc",
"taeniopygia_guttata",
"takifugu_rubripes",
"teleopsis_dalmanni",
"terrapene_carolina_triunguis",
"tetranychus_urticae",
"tetraodon_nigroviridis",
"thelohanellus_kitauei",
"theropithecus_gelada",
"thrips_palmi_gca012932325v1rs",
"tigriopus_californicus_gca007210705",
"trialeurodes_vaporariorum_gca011764245",
"tribolium_castaneum",
"trichinella_spiralis",
"trichogramma_pretiosum_gca000599845v3",
"trichoplax_adhaerens",
"trichuris_muris",
"tupaia_belangeri",
"tursiops_truncatus",
"urocitellus_parryii",
"ursus_americanus",
"ursus_maritimus",
"ursus_thibetanus_thibetanus",
"varanus_komodoensis",
"varroa_destructor_gca002443255",
"venturia_canescens_gca019457755v1rs",
"vicugna_pacos",
"vombatus_ursinus",
"vulpes_vulpes",
"xenopus_tropicalis",
"xiphophorus_couchianus",
"xiphophorus_maculatus",
"zalophus_californianus",
"zerene_cesonia_gca012273895v2rs",
"zonotrichia_albicollis",
"zootermopsis_nevadensis",
"zosterops_lateralis_melanops"
],
"cls_token": "[CLS]",
"mask_token": "[MASK]",
"pad_token": "[PAD]",
"sep_token": "[SEP]",
"unk_token": "[UNK]"
}