First version of the chinese_roberta_L-4_H-512 model and tokenizer.
Browse files
README.md
CHANGED
@@ -49,26 +49,26 @@ You can use this model directly with a pipeline for masked language modeling (ta
|
|
49 |
>>> unmasker = pipeline('fill-mask', model='uer/chinese_roberta_L-8_H-512')
|
50 |
>>> unmasker("中国的首都是[MASK]京。")
|
51 |
[
|
52 |
-
{'sequence': '[CLS] 中 国 的 首 都 是 北 京 。 [SEP]',
|
53 |
-
'score': 0.
|
54 |
'token': 1266,
|
55 |
'token_str': '北'},
|
56 |
-
{'sequence': '[CLS] 中 国 的 首 都 是 南 京 。 [SEP]',
|
57 |
-
'score': 0.
|
58 |
'token': 1298,
|
59 |
-
'token_str': '南'},
|
60 |
{'sequence': '[CLS] 中 国 的 首 都 是 东 京 。 [SEP]',
|
61 |
-
'score': 0.
|
62 |
'token': 691,
|
63 |
-
'token_str': '东'},
|
64 |
-
{'sequence': '[CLS] 中 国 的 首 都 是 普 京 。 [SEP]',
|
65 |
-
'score': 0.
|
66 |
-
'token': 3249,
|
67 |
'token_str': '普'},
|
68 |
-
{'sequence': '[CLS] 中 国 的 首 都 是
|
69 |
-
'score': 0.
|
70 |
-
'token':
|
71 |
-
'token_str': '
|
72 |
]
|
73 |
```
|
74 |
|
|
|
49 |
>>> unmasker = pipeline('fill-mask', model='uer/chinese_roberta_L-8_H-512')
|
50 |
>>> unmasker("中国的首都是[MASK]京。")
|
51 |
[
|
52 |
+
{'sequence': '[CLS] 中 国 的 首 都 是 北 京 。 [SEP]',
|
53 |
+
'score': 0.8701988458633423,
|
54 |
'token': 1266,
|
55 |
'token_str': '北'},
|
56 |
+
{'sequence': '[CLS] 中 国 的 首 都 是 南 京 。 [SEP]',
|
57 |
+
'score': 0.1194809079170227,
|
58 |
'token': 1298,
|
59 |
+
'token_str': '南'},
|
60 |
{'sequence': '[CLS] 中 国 的 首 都 是 东 京 。 [SEP]',
|
61 |
+
'score': 0.0037803512532263994,
|
62 |
'token': 691,
|
63 |
+
'token_str': '东'},
|
64 |
+
{'sequence': '[CLS] 中 国 的 首 都 是 普 京 。 [SEP]',
|
65 |
+
'score': 0.0017127094324678183,
|
66 |
+
'token': 3249,
|
67 |
'token_str': '普'},
|
68 |
+
{'sequence': '[CLS] 中 国 的 首 都 是 望 京 。 [SEP]',
|
69 |
+
'score': 0.001687526935711503,
|
70 |
+
'token': 3307,
|
71 |
+
'token_str': '望'}
|
72 |
]
|
73 |
```
|
74 |
|