hhou435 commited on
Commit
e9af3ee
·
1 Parent(s): 959fee5

First version of the chinese_roberta_L-4_H-512 model and tokenizer.

Browse files
Files changed (1) hide show
  1. README.md +14 -14
README.md CHANGED
@@ -49,26 +49,26 @@ You can use this model directly with a pipeline for masked language modeling (ta
49
  >>> unmasker = pipeline('fill-mask', model='uer/chinese_roberta_L-8_H-512')
50
  >>> unmasker("中国的首都是[MASK]京。")
51
  [
52
- {'sequence': '[CLS] 中 国 的 首 都 是 北 京 。 [SEP]',
53
- 'score': 0.9338967204093933,
54
  'token': 1266,
55
  'token_str': '北'},
56
- {'sequence': '[CLS] 中 国 的 首 都 是 南 京 。 [SEP]',
57
- 'score': 0.039428312331438065,
58
  'token': 1298,
59
- 'token_str': '南'},
60
  {'sequence': '[CLS] 中 国 的 首 都 是 东 京 。 [SEP]',
61
- 'score': 0.01681734062731266,
62
  'token': 691,
63
- 'token_str': '东'},
64
- {'sequence': '[CLS] 中 国 的 首 都 是 普 京 。 [SEP]',
65
- 'score': 0.004590896889567375,
66
- 'token': 3249,
67
  'token_str': '普'},
68
- {'sequence': '[CLS] 中 国 的 首 都 是 京 。 [SEP]',
69
- 'score': 0.0007656012894585729,
70
- 'token': 4242,
71
- 'token_str': ''}
72
  ]
73
  ```
74
 
 
49
  >>> unmasker = pipeline('fill-mask', model='uer/chinese_roberta_L-8_H-512')
50
  >>> unmasker("中国的首都是[MASK]京。")
51
  [
52
+ {'sequence': '[CLS] 中 国 的 首 都 是 北 京 。 [SEP]',
53
+ 'score': 0.8701988458633423,
54
  'token': 1266,
55
  'token_str': '北'},
56
+ {'sequence': '[CLS] 中 国 的 首 都 是 南 京 。 [SEP]',
57
+ 'score': 0.1194809079170227,
58
  'token': 1298,
59
+ 'token_str': '南'},
60
  {'sequence': '[CLS] 中 国 的 首 都 是 东 京 。 [SEP]',
61
+ 'score': 0.0037803512532263994,
62
  'token': 691,
63
+ 'token_str': '东'},
64
+ {'sequence': '[CLS] 中 国 的 首 都 是 普 京 。 [SEP]',
65
+ 'score': 0.0017127094324678183,
66
+ 'token': 3249,
67
  'token_str': '普'},
68
+ {'sequence': '[CLS] 中 国 的 首 都 是 京 。 [SEP]',
69
+ 'score': 0.001687526935711503,
70
+ 'token': 3307,
71
+ 'token_str': ''}
72
  ]
73
  ```
74