celiudos commited on
Commit
4cf5cee
·
verified ·
1 Parent(s): f98a508

Upload BertForTokenClassification

Browse files
Files changed (3) hide show
  1. README.md +32 -35
  2. config.json +9 -9
  3. model.safetensors +2 -2
README.md CHANGED
@@ -1,60 +1,57 @@
1
  ---
2
- language:
3
- - pt
4
- tags:
5
- - generated_from_trainer
6
  datasets:
7
  - carolina-c4ai/corpus-carolina
 
 
8
  metrics:
9
  - precision
10
  - recall
11
  - f1
12
  - accuracy
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
13
  model-index:
14
  - name: checkpoints
15
  results:
16
  - task:
17
- name: Token Classification
18
  type: token-classification
 
19
  dataset:
20
  name: carolina-c4ai/corpus-carolina
21
  type: carolina-c4ai/corpus-carolina
22
  metrics:
23
- - name: F1
24
- type: f1
25
  value: 0.9470445768148197
26
- - name: Precision
27
- type: precision
28
  value: 0.9544794827813696
29
- - name: Recall
30
- type: recall
31
  value: 0.9191397849462366
32
- - name: Accuracy
33
- type: accuracy
34
  value: 0.9470445768148197
35
- - name: Loss
36
- type: loss
37
  value: 0.939724603793193
38
- widget:
39
- - text: >-
40
- Falsificação de documento público, uso de documento falso. Anotação de
41
- Responsabilidade Técnica Nº 1055330634101 de 12 de janeiro de 2013 relativa
42
- à Lei Federal Nº 531. Trata-se de representação referente a possível
43
- falsificação documentação técnica registrada pelo CREA-SP, feita pelo senhor
44
- Francis Pantele da Cozzi, CPF: 412.612.341-32, telefone (31) 951358433,
45
- email [email protected], atinente à sua contratação pela senhora Marinalva Bete
46
- Raz, CPF: 049.567.041-22, telefone (61) 9412 3333, mulher branca, opinião
47
- política conservadora, religião evangélica. Marinalva Bete Raz reclama por
48
- indenização por danos morais no dia 14.05.2013 no valor de R$ 82.662,00
49
- (Oitenta e dois mil, seiscentos e sessenta e dois reais) relacionado ao
50
- endereço IP 192.168.01 e ao endereço constante no CEP 59123-222, Rua dos
51
- Pioneiros, nº 450, Jardim Esmeralda, Campo Grande, MS. Ela afirma que
52
- precisa deste dinheiro o mais rápido possível, já que sua saúde está
53
- comprometida, pois sofre de asma. A parte Francis Pantele da Cozzi afirma
54
- que apenas possui 5.534,00 reais como patrimônio e precisa do dinheiro para
55
- sustentar seu filho menor de idade chamado Josué Vittas.
56
- base_model:
57
- - pierreguillou/ner-bert-large-cased-pt-lenerbr
58
  ---
59
 
60
  ## NER model in the legal domain in Portuguese according to LGPD (Brazilian Law for Data Protection)
 
1
  ---
2
+ base_model:
3
+ - pierreguillou/ner-bert-large-cased-pt-lenerbr
 
 
4
  datasets:
5
  - carolina-c4ai/corpus-carolina
6
+ language:
7
+ - pt
8
  metrics:
9
  - precision
10
  - recall
11
  - f1
12
  - accuracy
13
+ tags:
14
+ - generated_from_trainer
15
+ widget:
16
+ - text: 'Falsificação de documento público, uso de documento falso. Anotação de Responsabilidade
17
+ Técnica Nº 1055330634101 de 12 de janeiro de 2013 relativa à Lei Federal Nº 531.
18
+ Trata-se de representação referente a possível falsificação documentação técnica
19
+ registrada pelo CREA-SP, feita pelo senhor Francis Pantele da Cozzi, CPF: 412.612.341-32,
20
+ telefone (31) 951358433, email [email protected], atinente à sua contratação pela senhora
21
+ Marinalva Bete Raz, CPF: 049.567.041-22, telefone (61) 9412 3333, mulher branca,
22
+ opinião política conservadora, religião evangélica. Marinalva Bete Raz reclama
23
+ por indenização por danos morais no dia 14.05.2013 no valor de R$ 82.662,00 (Oitenta
24
+ e dois mil, seiscentos e sessenta e dois reais) relacionado ao endereço IP 192.168.01
25
+ e ao endereço constante no CEP 59123-222, Rua dos Pioneiros, nº 450, Jardim Esmeralda,
26
+ Campo Grande, MS. Ela afirma que precisa deste dinheiro o mais rápido possível,
27
+ já que sua saúde está comprometida, pois sofre de asma. A parte Francis Pantele
28
+ da Cozzi afirma que apenas possui 5.534,00 reais como patrimônio e precisa do
29
+ dinheiro para sustentar seu filho menor de idade chamado Josué Vittas.'
30
  model-index:
31
  - name: checkpoints
32
  results:
33
  - task:
 
34
  type: token-classification
35
+ name: Token Classification
36
  dataset:
37
  name: carolina-c4ai/corpus-carolina
38
  type: carolina-c4ai/corpus-carolina
39
  metrics:
40
+ - type: f1
 
41
  value: 0.9470445768148197
42
+ name: F1
43
+ - type: precision
44
  value: 0.9544794827813696
45
+ name: Precision
46
+ - type: recall
47
  value: 0.9191397849462366
48
+ name: Recall
49
+ - type: accuracy
50
  value: 0.9470445768148197
51
+ name: Accuracy
52
+ - type: loss
53
  value: 0.939724603793193
54
+ name: Loss
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
55
  ---
56
 
57
  ## NER model in the legal domain in Portuguese according to LGPD (Brazilian Law for Data Protection)
config.json CHANGED
@@ -1,5 +1,5 @@
1
  {
2
- "_name_or_path": "celiudos/legal-bert-lgpd",
3
  "architectures": [
4
  "BertForTokenClassification"
5
  ],
@@ -12,13 +12,6 @@
12
  "id2label": {
13
  "0": "O",
14
  "1": "B-NOME",
15
- "10": "I-CPF",
16
- "11": "B-TELEFONE",
17
- "12": "I-TELEFONE",
18
- "13": "B-EMAIL",
19
- "14": "I-EMAIL",
20
- "15": "B-DINHEIRO",
21
- "16": "I-DINHEIRO",
22
  "2": "I-NOME",
23
  "3": "B-DATA",
24
  "4": "I-DATA",
@@ -26,7 +19,14 @@
26
  "6": "I-ENDERECO",
27
  "7": "B-CEP",
28
  "8": "I-CEP",
29
- "9": "B-CPF"
 
 
 
 
 
 
 
30
  },
31
  "initializer_range": 0.02,
32
  "intermediate_size": 4096,
 
1
  {
2
+ "_name_or_path": "../../files/pipe/model/legal_bert_lgpd",
3
  "architectures": [
4
  "BertForTokenClassification"
5
  ],
 
12
  "id2label": {
13
  "0": "O",
14
  "1": "B-NOME",
 
 
 
 
 
 
 
15
  "2": "I-NOME",
16
  "3": "B-DATA",
17
  "4": "I-DATA",
 
19
  "6": "I-ENDERECO",
20
  "7": "B-CEP",
21
  "8": "I-CEP",
22
+ "9": "B-CPF",
23
+ "10": "I-CPF",
24
+ "11": "B-TELEFONE",
25
+ "12": "I-TELEFONE",
26
+ "13": "B-EMAIL",
27
+ "14": "I-EMAIL",
28
+ "15": "B-DINHEIRO",
29
+ "16": "I-DINHEIRO"
30
  },
31
  "initializer_range": 0.02,
32
  "intermediate_size": 4096,
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:cf811d602428782514479ea3da38103c2b0a0a5aceb3d687c143a2144ccc6cb7
3
- size 1337630536
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c016858360603eee0892ac8eea6617b06e130f6cfdc83e6d576455ef1bc2732a
3
+ size 1333503780