File size: 3,944 Bytes
118976d
7a71608
 
118976d
 
c15f189
 
 
118976d
 
 
beb4820
0bdf7c5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
118976d
 
 
 
 
d05544e
118976d
d05544e
118976d
d05544e
118976d
d05544e
 
118976d
d05544e
118976d
d05544e
 
 
 
 
 
 
118976d
d05544e
 
 
 
 
118976d
0bdf7c5
d05544e
 
118976d
 
 
 
 
 
 
 
 
 
7a71608
118976d
d05544e
 
118976d
 
 
 
7a71608
 
 
 
 
 
 
 
 
 
118976d
 
 
 
 
 
 
0bdf7c5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
---
license: mit
base_model: neuralmind/bert-base-portuguese-cased
tags:
- generated_from_trainer
- portuguese
- qa
- bert
model-index:
- name: finetune-BERT-squad
  results: []
widget:
- text: Onde Cristiano Ronaldo começou sua carreira ?
  context: >-
    Cristiano Ronaldo é jogador de futebol considerado por muitos um dos
    melhores de todos os tempos. Português, começou a carreira no Sporting e já
    atuou por Manchester United, Real Madrid, Juventus e Al-Nassr. Foi cinco
    vezes campeão da Liga dos Campeões da Europa. Também foi campeão da Eurocopa
    com Portugal no que é considerado o maior título já conquistado pela equipe
    portuguesa. Disputou cinco Copas do Mundo. Atualmente, é o atleta com mais
    gols marcados por seleções nacionais.
  example_title: Cristiano Ronaldo
- text: A quem foram feitas criticas ?
  context: >-
    O objetivo do depoimento é coletar informações sobre um áudio revelado pela
    revista Veja, em que o ex-ajudante de ordens faz críticas à Polícia Federal
    e ao ministro Alexandre de Moraes. Nas gravações, o ex-ajudante de ordens de
    Bolsonaro disse que foi pressionado por agentes da investigação a relatar
    fatos que não aconteceram e que não tinha conhecimento.
  example_title: Depoimento Cid
language:
- pt
metrics:
- accuracy
library_name: transformers
pipeline_tag: question-answering
---

<!-- This model card has been generated automatically according to the information the Trainer had access to. You
should probably proofread and complete it, then remove this comment. -->

# bert-squad-portuguese

This model aims to help reduce the need for models in Portuguese.

## How to use:

```python
from transformers import AutoModelForQuestionAnswering, AutoTokenizer, pipeline

model_name = "rhaymison/bert-squad-portuguese"

nlp = pipeline('question-answering', model=model_name, tokenizer=model_name)
QA_input = {
    'question': 'Onde Cristiano Ronaldo começou sua carreira ?',
    'context': 'Cristiano Ronaldo é jogador de futebol considerado por muitos um dos melhores de todos os tempos. Português, começou a carreira no Sporting e já atuou por Manchester United, Real Madrid, Juventus e Al-Nassr. Foi cinco vezes campeão da Liga dos Campeões da Europa. Também foi campeão da Eurocopa com Portugal no que é considerado o maior título já conquistado pela equipe portuguesa. Disputou cinco Copas do Mundo. Atualmente, é o atleta com mais gols marcados por seleções nacionais.'
}
res = nlp(QA_input)
```

If you need load model and tokenizer
```python
model = AutoModelForQuestionAnswering.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
```

This model is a fine-tuned version of [neuralmind/bert-base-portuguese-cased](https://huggingface.co/neuralmind/bert-base-portuguese-cased).
It achieves the following results on the evaluation set:
- Loss: 1.0687

### Training hyperparameters

The following hyperparameters were used during training:
- learning_rate: 2e-05
- train_batch_size: 16
- eval_batch_size: 16
- seed: 42
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
- lr_scheduler_type: linear
- num_epochs: 2

GPU: T4

### Training results

| Training Loss | Epoch | Step  | Validation Loss |
|:-------------:|:-----:|:-----:|:---------------:|
| 1.4612        | 0.19  | 1000  | 1.3505          |
| 1.2999        | 0.37  | 2000  | 1.2518          |
| 1.2234        | 0.56  | 3000  | 1.1492          |
| 1.1824        | 0.74  | 4000  | 1.1181          |
| 1.1169        | 0.93  | 5000  | 1.0850          |
| 0.8933        | 1.11  | 6000  | 1.0925          |
| 0.9004        | 1.3   | 7000  | 1.0849          |
| 0.8706        | 1.49  | 8000  | 1.0976          |
| 0.8617        | 1.67  | 9000  | 1.0779          |
| 0.8756        | 1.86  | 10000 | 1.0687          |


### Framework versions

- Transformers 4.38.2
- Pytorch 2.2.1+cu121
- Datasets 2.18.0
- Tokenizers 0.15.2