Upload BertForTokenClassification
Browse files- README.md +32 -35
- config.json +9 -9
- model.safetensors +2 -2
README.md
CHANGED
@@ -1,60 +1,57 @@
|
|
1 |
---
|
2 |
-
|
3 |
-
- pt
|
4 |
-
tags:
|
5 |
-
- generated_from_trainer
|
6 |
datasets:
|
7 |
- carolina-c4ai/corpus-carolina
|
|
|
|
|
8 |
metrics:
|
9 |
- precision
|
10 |
- recall
|
11 |
- f1
|
12 |
- accuracy
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13 |
model-index:
|
14 |
- name: checkpoints
|
15 |
results:
|
16 |
- task:
|
17 |
-
name: Token Classification
|
18 |
type: token-classification
|
|
|
19 |
dataset:
|
20 |
name: carolina-c4ai/corpus-carolina
|
21 |
type: carolina-c4ai/corpus-carolina
|
22 |
metrics:
|
23 |
-
-
|
24 |
-
type: f1
|
25 |
value: 0.9470445768148197
|
26 |
-
|
27 |
-
|
28 |
value: 0.9544794827813696
|
29 |
-
|
30 |
-
|
31 |
value: 0.9191397849462366
|
32 |
-
|
33 |
-
|
34 |
value: 0.9470445768148197
|
35 |
-
|
36 |
-
|
37 |
value: 0.939724603793193
|
38 |
-
|
39 |
-
- text: >-
|
40 |
-
Falsificação de documento público, uso de documento falso. Anotação de
|
41 |
-
Responsabilidade Técnica Nº 1055330634101 de 12 de janeiro de 2013 relativa
|
42 |
-
à Lei Federal Nº 531. Trata-se de representação referente a possível
|
43 |
-
falsificação documentação técnica registrada pelo CREA-SP, feita pelo senhor
|
44 |
-
Francis Pantele da Cozzi, CPF: 412.612.341-32, telefone (31) 951358433,
|
45 |
-
email [email protected], atinente à sua contratação pela senhora Marinalva Bete
|
46 |
-
Raz, CPF: 049.567.041-22, telefone (61) 9412 3333, mulher branca, opinião
|
47 |
-
política conservadora, religião evangélica. Marinalva Bete Raz reclama por
|
48 |
-
indenização por danos morais no dia 14.05.2013 no valor de R$ 82.662,00
|
49 |
-
(Oitenta e dois mil, seiscentos e sessenta e dois reais) relacionado ao
|
50 |
-
endereço IP 192.168.01 e ao endereço constante no CEP 59123-222, Rua dos
|
51 |
-
Pioneiros, nº 450, Jardim Esmeralda, Campo Grande, MS. Ela afirma que
|
52 |
-
precisa deste dinheiro o mais rápido possível, já que sua saúde está
|
53 |
-
comprometida, pois sofre de asma. A parte Francis Pantele da Cozzi afirma
|
54 |
-
que apenas possui 5.534,00 reais como patrimônio e precisa do dinheiro para
|
55 |
-
sustentar seu filho menor de idade chamado Josué Vittas.
|
56 |
-
base_model:
|
57 |
-
- pierreguillou/ner-bert-large-cased-pt-lenerbr
|
58 |
---
|
59 |
|
60 |
## NER model in the legal domain in Portuguese according to LGPD (Brazilian Law for Data Protection)
|
|
|
1 |
---
|
2 |
+
base_model:
|
3 |
+
- pierreguillou/ner-bert-large-cased-pt-lenerbr
|
|
|
|
|
4 |
datasets:
|
5 |
- carolina-c4ai/corpus-carolina
|
6 |
+
language:
|
7 |
+
- pt
|
8 |
metrics:
|
9 |
- precision
|
10 |
- recall
|
11 |
- f1
|
12 |
- accuracy
|
13 |
+
tags:
|
14 |
+
- generated_from_trainer
|
15 |
+
widget:
|
16 |
+
- text: 'Falsificação de documento público, uso de documento falso. Anotação de Responsabilidade
|
17 |
+
Técnica Nº 1055330634101 de 12 de janeiro de 2013 relativa à Lei Federal Nº 531.
|
18 |
+
Trata-se de representação referente a possível falsificação documentação técnica
|
19 |
+
registrada pelo CREA-SP, feita pelo senhor Francis Pantele da Cozzi, CPF: 412.612.341-32,
|
20 |
+
telefone (31) 951358433, email [email protected], atinente à sua contratação pela senhora
|
21 |
+
Marinalva Bete Raz, CPF: 049.567.041-22, telefone (61) 9412 3333, mulher branca,
|
22 |
+
opinião política conservadora, religião evangélica. Marinalva Bete Raz reclama
|
23 |
+
por indenização por danos morais no dia 14.05.2013 no valor de R$ 82.662,00 (Oitenta
|
24 |
+
e dois mil, seiscentos e sessenta e dois reais) relacionado ao endereço IP 192.168.01
|
25 |
+
e ao endereço constante no CEP 59123-222, Rua dos Pioneiros, nº 450, Jardim Esmeralda,
|
26 |
+
Campo Grande, MS. Ela afirma que precisa deste dinheiro o mais rápido possível,
|
27 |
+
já que sua saúde está comprometida, pois sofre de asma. A parte Francis Pantele
|
28 |
+
da Cozzi afirma que apenas possui 5.534,00 reais como patrimônio e precisa do
|
29 |
+
dinheiro para sustentar seu filho menor de idade chamado Josué Vittas.'
|
30 |
model-index:
|
31 |
- name: checkpoints
|
32 |
results:
|
33 |
- task:
|
|
|
34 |
type: token-classification
|
35 |
+
name: Token Classification
|
36 |
dataset:
|
37 |
name: carolina-c4ai/corpus-carolina
|
38 |
type: carolina-c4ai/corpus-carolina
|
39 |
metrics:
|
40 |
+
- type: f1
|
|
|
41 |
value: 0.9470445768148197
|
42 |
+
name: F1
|
43 |
+
- type: precision
|
44 |
value: 0.9544794827813696
|
45 |
+
name: Precision
|
46 |
+
- type: recall
|
47 |
value: 0.9191397849462366
|
48 |
+
name: Recall
|
49 |
+
- type: accuracy
|
50 |
value: 0.9470445768148197
|
51 |
+
name: Accuracy
|
52 |
+
- type: loss
|
53 |
value: 0.939724603793193
|
54 |
+
name: Loss
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
55 |
---
|
56 |
|
57 |
## NER model in the legal domain in Portuguese according to LGPD (Brazilian Law for Data Protection)
|
config.json
CHANGED
@@ -1,5 +1,5 @@
|
|
1 |
{
|
2 |
-
"_name_or_path": "
|
3 |
"architectures": [
|
4 |
"BertForTokenClassification"
|
5 |
],
|
@@ -12,13 +12,6 @@
|
|
12 |
"id2label": {
|
13 |
"0": "O",
|
14 |
"1": "B-NOME",
|
15 |
-
"10": "I-CPF",
|
16 |
-
"11": "B-TELEFONE",
|
17 |
-
"12": "I-TELEFONE",
|
18 |
-
"13": "B-EMAIL",
|
19 |
-
"14": "I-EMAIL",
|
20 |
-
"15": "B-DINHEIRO",
|
21 |
-
"16": "I-DINHEIRO",
|
22 |
"2": "I-NOME",
|
23 |
"3": "B-DATA",
|
24 |
"4": "I-DATA",
|
@@ -26,7 +19,14 @@
|
|
26 |
"6": "I-ENDERECO",
|
27 |
"7": "B-CEP",
|
28 |
"8": "I-CEP",
|
29 |
-
"9": "B-CPF"
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
30 |
},
|
31 |
"initializer_range": 0.02,
|
32 |
"intermediate_size": 4096,
|
|
|
1 |
{
|
2 |
+
"_name_or_path": "../../files/pipe/model/legal_bert_lgpd",
|
3 |
"architectures": [
|
4 |
"BertForTokenClassification"
|
5 |
],
|
|
|
12 |
"id2label": {
|
13 |
"0": "O",
|
14 |
"1": "B-NOME",
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
"2": "I-NOME",
|
16 |
"3": "B-DATA",
|
17 |
"4": "I-DATA",
|
|
|
19 |
"6": "I-ENDERECO",
|
20 |
"7": "B-CEP",
|
21 |
"8": "I-CEP",
|
22 |
+
"9": "B-CPF",
|
23 |
+
"10": "I-CPF",
|
24 |
+
"11": "B-TELEFONE",
|
25 |
+
"12": "I-TELEFONE",
|
26 |
+
"13": "B-EMAIL",
|
27 |
+
"14": "I-EMAIL",
|
28 |
+
"15": "B-DINHEIRO",
|
29 |
+
"16": "I-DINHEIRO"
|
30 |
},
|
31 |
"initializer_range": 0.02,
|
32 |
"intermediate_size": 4096,
|
model.safetensors
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:c016858360603eee0892ac8eea6617b06e130f6cfdc83e6d576455ef1bc2732a
|
3 |
+
size 1333503780
|