KoichiYasuoka
/

roberta-classical-chinese-base-upos

Token Classification

Literary Chinese

classical chinese

literary chinese

ancient chinese

dependency-parsing

Inference Endpoints

Model card Files Files and versions Community

KoichiYasuoka commited on Feb 11, 2022

Commit

750f3fc

·

1 Parent(s): 1e51901

dependency-parsing

Files changed (1) hide show

README.md +10 -4

README.md CHANGED Viewed

@@ -7,6 +7,7 @@ tags:
 - "ancient chinese"
 - "token-classification"
 - "pos"
 datasets:
 - "universal_dependencies"
 license: "apache-2.0"
@@ -19,7 +20,7 @@ widget:
 ## Model Description
-This is a RoBERTa model pre-trained on Classical Chinese texts for POS-tagging, derived from [roberta-classical-chinese-base-char](https://huggingface.co/KoichiYasuoka/roberta-classical-chinese-base-char). Every word is tagged by [UPOS](https://universaldependencies.org/u/pos/) (Universal Part-Of-Speech).
 ## How to Use
@@ -28,11 +29,16 @@ import torch
 from transformers import AutoTokenizer,AutoModelForTokenClassification
 tokenizer=AutoTokenizer.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-upos")
 model=AutoModelForTokenClassification.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-upos")
-s="子曰學而時習之不亦説乎有朋自遠方來不亦樂乎人不知而不慍不亦君子乎"
-p=[model.config.id2label[q] for q in torch.argmax(model(tokenizer.encode(s,return_tensors="pt"))["logits"],dim=2)[0].tolist()[1:-1]]
-print(list(zip(s,p)))
 ```
 ## Reference
 Koichi Yasuoka: [Universal Dependencies Treebank of the Four Books in Classical Chinese](http://hdl.handle.net/2433/245217), DADH2019: 10th International Conference of Digital Archives and Digital Humanities (December 2019), pp.20-28.

 - "ancient chinese"
 - "token-classification"
 - "pos"
+- "dependency-parsing"
 datasets:
 - "universal_dependencies"
 license: "apache-2.0"
 ## Model Description
+This is a RoBERTa model pre-trained on Classical Chinese texts for POS-tagging and dependency-parsing, derived from [roberta-classical-chinese-base-char](https://huggingface.co/KoichiYasuoka/roberta-classical-chinese-base-char). Every word is tagged by [UPOS](https://universaldependencies.org/u/pos/) (Universal Part-Of-Speech).
 ## How to Use
 from transformers import AutoTokenizer,AutoModelForTokenClassification
 tokenizer=AutoTokenizer.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-upos")
 model=AutoModelForTokenClassification.from_pretrained("KoichiYasuoka/roberta-classical-chinese-base-upos")
 ```
+or
+```py
+import esupar
+nlp=esupar.load("KoichiYasuoka/bert-base-japanese-upos")
+```
 ## Reference
 Koichi Yasuoka: [Universal Dependencies Treebank of the Four Books in Classical Chinese](http://hdl.handle.net/2433/245217), DADH2019: 10th International Conference of Digital Archives and Digital Humanities (December 2019), pp.20-28.