--- language: - "ja" tags: - "japanese" - "pos" - "dependency-parsing" base_model: Kendamarron/Tokara-0.5B-v0.1 datasets: - "universal_dependencies" license: "apache-2.0" pipeline_tag: "token-classification" widget: - text: "全学年にわたって小学校の国語の教科書に挿し絵が用いられている" --- # Tokara-0.5B-ud-causal ## Model Description This is a Qwen1.5 model pretrained for POS-tagging and dependency-parsing, derived from [Tokara-0.5B-v0.1](https://huggingface.co/Kendamarron/Tokara-0.5B-v0.1) refined for [UD_Japanese-GSDLUW](https://github.com/UniversalDependencies/UD_Japanese-GSDLUW). ## How to Use ``` from transformers import pipeline nlp=pipeline("universal-dependencies","KoichiYasuoka/Tokara-0.5B-ud-causal",trust_remote_code=True) print(nlp("全学年にわたって小学校の国語の教科書に挿し絵が用いられている")) ``` ## Reference 安岡孝一: [GPT系言語モデルによる国語研長単位係り受け解析](http://id.nii.ac.jp/1001/00241391/), 人文科学とコンピュータシンポジウム「じんもんこん2024」論文集 (2024年12月), pp.83-90.