sagorsarker
/

bangla-bert-base

Inference Endpoints

Model card Files Files and versions Community

sagorsarker commited on Dec 24, 2020

Commit

6dc6003

·

1 Parent(s): 1c01dc3

Update README.md

Files changed (1) hide show

README.md +15 -1

README.md CHANGED Viewed

@@ -82,6 +82,21 @@ Here is the [evaluation script](https://github.com/sagorbrur/bangla-bert/blob/ma
 ## How to Use
 You can use this model directly with a pipeline for masked language modeling:
 ```py
@@ -97,7 +112,6 @@ for pred in nlp(f"আমি বাংলায় {nlp.tokenizer.mask_token} গা
 ```
 ## Author
 [Sagor Sarker](https://github.com/sagorbrur)

 ## How to Use
+**Bangla BERT Tokenizer**
+```py
+from transformers import AutoTokenizer, AutoModel
+bnbert_tokenizer = AutoTokenizer.from_pretrained("sagorsarker/bangla-bert-base")
+text = "আমি বাংলায় গান গাই।"
+bnbert_tokenizer.tokenize(text)
+# ['আমি', 'বাংলা', '##য', 'গান', 'গাই', '।']
+```
+**MASK Generation**
 You can use this model directly with a pipeline for masked language modeling:
 ```py
 ```
 ## Author
 [Sagor Sarker](https://github.com/sagorbrur)