Language Modeling with Phonemes

https://github.com/codebyzeb/PhonemeTransformers

tweetbyzeb

codebyzeb

Activity Feed Request to join this org

AI & ML interests

tokenization, CHILDES, word segmentation, phonemes, BabyLM

Organization Card

Community About org cards

Edit this README.md markdown file to author your organization card.

Collections 3

View 3 collections

spaces 2

segmentation_scores

🚀

models 36

datasets 3

phonemetransformers/IPA-BabyLM

Viewer • Updated Apr 8, 2025 • 12.5M • 201 • 2

phonemetransformers/IPA-CHILDES

Viewer • Updated Apr 8, 2025 • 12.5M • 93 • 5

phonemetransformers/IPA-BabyLM-evaluation

Preview • Updated Apr 3, 2025 • 4

Language Modeling with Phonemes

AI & ML interests

Collections 3

BabyLM's First Words: Word Segmentation as a Phonological Probing Task

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models-large

IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models

BabyLM's First Words: Word Segmentation as a Phonological Probing Task

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models-large

IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling

phonemetransformers/IPA-CHILDES

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-models

spaces 2

segmentation_scores

models 36

phonemetransformers/ipa-childes-models-tiny

phonemetransformers/ipa-childes-models-small

phonemetransformers/ipa-childes-models-medium

phonemetransformers/ipa-childes-models-large

phonemetransformers/ipa-childes-tokenizers

phonemetransformers/ipa-childes-english-size-comparison

phonemetransformers/ipa-childes-models

phonemetransformers/babble-tokenizers

phonemetransformers/childes-phoneme-tokenizers

phonemetransformers/GPT2-85M-BPE-TXT

datasets 3

phonemetransformers/IPA-BabyLM

phonemetransformers/IPA-CHILDES

phonemetransformers/IPA-BabyLM-evaluation

AI & ML interests

Team members 1

Collections 3

spaces 2

segmentation_scores

models 36 Sort: Recently updated

datasets 3 Sort: Recently updated

models 36

datasets 3