RogerioFreitas
commited on
Commit
·
df860a5
1
Parent(s):
b925bf3
Update README.md
Browse files
README.md
CHANGED
@@ -29,41 +29,22 @@ model-index:
|
|
29 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
30 |
should probably proofread and complete it, then remove this comment. -->
|
31 |
|
32 |
-
#
|
33 |
|
34 |
-
|
35 |
-
It achieves the following results on the evaluation set:
|
36 |
-
- Loss: 0.2628
|
37 |
-
- Wer: 6.5987
|
38 |
|
39 |
-
##
|
40 |
|
41 |
-
|
42 |
|
43 |
-
|
|
|
44 |
|
45 |
-
|
46 |
|
47 |
-
|
48 |
|
49 |
-
|
50 |
-
|
51 |
-
## Training procedure
|
52 |
-
|
53 |
-
### Training hyperparameters
|
54 |
-
|
55 |
-
The following hyperparameters were used during training:
|
56 |
-
- learning_rate: 9e-06
|
57 |
-
- train_batch_size: 32
|
58 |
-
- eval_batch_size: 16
|
59 |
-
- seed: 42
|
60 |
-
- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
|
61 |
-
- lr_scheduler_type: linear
|
62 |
-
- lr_scheduler_warmup_steps: 500
|
63 |
-
- training_steps: 6000
|
64 |
-
- mixed_precision_training: Native AMP
|
65 |
-
|
66 |
-
### Training results
|
67 |
|
68 |
| Training Loss | Epoch | Step | Validation Loss | Wer |
|
69 |
|:-------------:|:-----:|:----:|:---------------:|:------:|
|
|
|
29 |
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
|
30 |
should probably proofread and complete it, then remove this comment. -->
|
31 |
|
32 |
+
# Modelo Flax do Pierre em Português para Reconhecimento de Fala (ASR)
|
33 |
|
34 |
+
Este repositório é um fork do repositório original criado por [Pierre Guillou](https://github.com/piegu). Ele contém uma versão convertida do modelo Whisper da OpenAI, fine-tuned no conjunto de dados `common_voice_11_0` para o idioma Português.
|
|
|
|
|
|
|
35 |
|
36 |
+
## Resultados
|
37 |
|
38 |
+
O modelo atinge os seguintes resultados no conjunto de avaliação:
|
39 |
|
40 |
+
- Perda (Loss): 0.2628
|
41 |
+
- Taxa de Erro de Palavra (Word Error Rate - WER): 6.5987
|
42 |
|
43 |
+
Para obter mais informações sobre este modelo, consulte este post do autor no blog: [Speech-to-Text & IA | Transcreva qualquer áudio para o português com o Whisper (OpenAI)... sem nenhum custo!](https://medium.com/@pierre_guillou).
|
44 |
|
45 |
+
Este modelo, batizado de "Portuguese Medium Whisper", é superior ao modelo original Whisper Medium da OpenAI na transcrição de áudios em português (e inclusive melhor que o modelo Whisper Large, que possui um WER de 7.1).
|
46 |
|
47 |
+
## Treinamento
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
48 |
|
49 |
| Training Loss | Epoch | Step | Validation Loss | Wer |
|
50 |
|:-------------:|:-----:|:----:|:---------------:|:------:|
|