jonatasgrosman
commited on
Commit
·
ce33427
1
Parent(s):
65ea5d5
update eval results
Browse files
README.md
CHANGED
@@ -9,6 +9,7 @@ datasets:
|
|
9 |
- mozilla-foundation/common_voice_11_0
|
10 |
metrics:
|
11 |
- wer
|
|
|
12 |
model-index:
|
13 |
- name: Whisper Large Portuguese
|
14 |
results:
|
@@ -28,6 +29,22 @@ model-index:
|
|
28 |
- name: CER
|
29 |
type: cer
|
30 |
value: 1.6052355927195898
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
31 |
---
|
32 |
|
33 |
# Whisper Large Portuguese
|
@@ -59,6 +76,8 @@ transcription = transcriber("path/to/my_audio.wav")
|
|
59 |
|
60 |
## Evaluation
|
61 |
|
|
|
|
|
62 |
### Common Voice 11
|
63 |
|
64 |
| | CER | WER |
|
@@ -74,7 +93,9 @@ transcription = transcriber("path/to/my_audio.wav")
|
|
74 |
| --- | --- | --- |
|
75 |
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) | 4.88 | 12.08 |
|
76 |
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization | 5.46 | 8.57 |
|
77 |
-
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) +
|
|
|
78 |
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) | 3.52 | 10.55 |
|
79 |
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization | 4.19 | 7.04 |
|
80 |
-
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) +
|
|
|
|
9 |
- mozilla-foundation/common_voice_11_0
|
10 |
metrics:
|
11 |
- wer
|
12 |
+
- cer
|
13 |
model-index:
|
14 |
- name: Whisper Large Portuguese
|
15 |
results:
|
|
|
29 |
- name: CER
|
30 |
type: cer
|
31 |
value: 1.6052355927195898
|
32 |
+
- task:
|
33 |
+
name: Automatic Speech Recognition
|
34 |
+
type: automatic-speech-recognition
|
35 |
+
dataset:
|
36 |
+
name: google/fleurs pt_br
|
37 |
+
type: google/fleurs
|
38 |
+
config: pt_br
|
39 |
+
split: test
|
40 |
+
args: pt_br
|
41 |
+
metrics:
|
42 |
+
- name: WER
|
43 |
+
type: wer
|
44 |
+
value: 8.56762285333714
|
45 |
+
- name: CER
|
46 |
+
type: cer
|
47 |
+
value: 5.462965196208485
|
48 |
---
|
49 |
|
50 |
# Whisper Large Portuguese
|
|
|
76 |
|
77 |
## Evaluation
|
78 |
|
79 |
+
We perform evaluation of the model using the test split of two datasets, the [Common Voice 11](https://huggingface.co/datasets/mozilla-foundation/common_voice_11_0) (same dataset used for the fine-tuning) and the [Fleurs](https://huggingface.co/datasets/google/fleurs) (dataset not seen during the fine-tuning). As Whisper can transcribe casing and punctuation, I performed the model evaluation in 2 different scenarios, one using the raw text and the other using the normalized text (lowercase + removal of punctuations). Additionally, for the Fleurs dataset, I evaluated the model in a scenario where there are no transcriptions of numerical values since the way these values are described in this dataset is different from how they are described in the dataset used in fine-tuning (Common Voice), so it is expected that this difference in the way of describing numerical values will affect the performance of the model for this type of transcription in Fleurs.
|
80 |
+
|
81 |
### Common Voice 11
|
82 |
|
83 |
| | CER | WER |
|
|
|
93 |
| --- | --- | --- |
|
94 |
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) | 4.88 | 12.08 |
|
95 |
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization | 5.46 | 8.57 |
|
96 |
+
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + keep only non-numeric samples | 2.35 | 9.00 |
|
97 |
+
| [jonatasgrosman/whisper-large-pt-cv11](https://huggingface.co/jonatasgrosman/whisper-large-pt-cv11) + text normalization + keep only non-numeric samples | 3.36 | 6.05 |
|
98 |
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) | 3.52 | 10.55 |
|
99 |
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization | 4.19 | 7.04 |
|
100 |
+
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + keep only non-numeric samples | 2.61 | 9.29 |
|
101 |
+
| [openai/whisper-large-v2](https://huggingface.co/openai/whisper-large-v2) + text normalization + keep only non-numeric samples | 3.56 | 6.15 |
|
evaluation_cv11_test.json
CHANGED
@@ -2,6 +2,8 @@
|
|
2 |
"raw": {
|
3 |
"cer": 0.0251556372013005,
|
4 |
"wer": 0.09564805574818598,
|
|
|
|
|
5 |
"references": [
|
6 |
"Xeque-mate",
|
7 |
"É necessário fornecer, quando formulado, uma avaliação.",
|
@@ -17396,6 +17398,8 @@
|
|
17396 |
"normalized": {
|
17397 |
"cer": 0.016052355927195897,
|
17398 |
"wer": 0.048166641448529786,
|
|
|
|
|
17399 |
"references": [
|
17400 |
"xeque mate",
|
17401 |
"é necessário fornecer quando formulado uma avaliação ",
|
|
|
2 |
"raw": {
|
3 |
"cer": 0.0251556372013005,
|
4 |
"wer": 0.09564805574818598,
|
5 |
+
"non_numeric_samples_cer": 0.0251556372013005,
|
6 |
+
"non_numeric_samples_wer": 0.09564805574818598,
|
7 |
"references": [
|
8 |
"Xeque-mate",
|
9 |
"É necessário fornecer, quando formulado, uma avaliação.",
|
|
|
17398 |
"normalized": {
|
17399 |
"cer": 0.016052355927195897,
|
17400 |
"wer": 0.048166641448529786,
|
17401 |
+
"non_numeric_samples_cer": 0.016052355927195897,
|
17402 |
+
"non_numeric_samples_wer": 0.048166641448529786,
|
17403 |
"references": [
|
17404 |
"xeque mate",
|
17405 |
"é necessário fornecer quando formulado uma avaliação ",
|
evaluation_fleurs_test.json
CHANGED
@@ -2,6 +2,8 @@
|
|
2 |
"raw": {
|
3 |
"cer": 0.048782744819821554,
|
4 |
"wer": 0.12084038353073887,
|
|
|
|
|
5 |
"references": [
|
6 |
"Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
|
7 |
"O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
|
@@ -1848,6 +1850,8 @@
|
|
1848 |
"normalized": {
|
1849 |
"cer": 0.05462965196208485,
|
1850 |
"wer": 0.0856762285333714,
|
|
|
|
|
1851 |
"references": [
|
1852 |
"em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
|
1853 |
"o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
|
|
|
2 |
"raw": {
|
3 |
"cer": 0.048782744819821554,
|
4 |
"wer": 0.12084038353073887,
|
5 |
+
"non_numeric_samples_cer": 0.023466183693758427,
|
6 |
+
"non_numeric_samples_wer": 0.09003507074616036,
|
7 |
"references": [
|
8 |
"Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
|
9 |
"O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
|
|
|
1850 |
"normalized": {
|
1851 |
"cer": 0.05462965196208485,
|
1852 |
"wer": 0.0856762285333714,
|
1853 |
+
"non_numeric_samples_cer": 0.03360758611072375,
|
1854 |
+
"non_numeric_samples_wer": 0.06055188032659872,
|
1855 |
"references": [
|
1856 |
"em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
|
1857 |
"o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
|
evaluation_whisper-large-v2_cv11_test.json
CHANGED
@@ -2,6 +2,8 @@
|
|
2 |
"raw": {
|
3 |
"cer": 0.04322850602866349,
|
4 |
"wer": 0.13918441215770513,
|
|
|
|
|
5 |
"references": [
|
6 |
"Xeque-mate",
|
7 |
"É necessário fornecer, quando formulado, uma avaliação.",
|
@@ -17396,6 +17398,8 @@
|
|
17396 |
"normalized": {
|
17397 |
"cer": 0.028362444828419743,
|
17398 |
"wer": 0.07020729308518686,
|
|
|
|
|
17399 |
"references": [
|
17400 |
"xeque mate",
|
17401 |
"é necessário fornecer quando formulado uma avaliação ",
|
|
|
2 |
"raw": {
|
3 |
"cer": 0.04322850602866349,
|
4 |
"wer": 0.13918441215770513,
|
5 |
+
"non_numeric_samples_cer": 0.04322850602866349,
|
6 |
+
"non_numeric_samples_wer": 0.13918441215770513,
|
7 |
"references": [
|
8 |
"Xeque-mate",
|
9 |
"É necessário fornecer, quando formulado, uma avaliação.",
|
|
|
17398 |
"normalized": {
|
17399 |
"cer": 0.028362444828419743,
|
17400 |
"wer": 0.07020729308518686,
|
17401 |
+
"non_numeric_samples_cer": 0.028362444828419743,
|
17402 |
+
"non_numeric_samples_wer": 0.07020729308518686,
|
17403 |
"references": [
|
17404 |
"xeque mate",
|
17405 |
"é necessário fornecer quando formulado uma avaliação ",
|
evaluation_whisper-large-v2_fleurs_test.json
CHANGED
@@ -2,6 +2,8 @@
|
|
2 |
"raw": {
|
3 |
"cer": 0.03522598456164162,
|
4 |
"wer": 0.10547095318668923,
|
|
|
|
|
5 |
"references": [
|
6 |
"Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
|
7 |
"O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
|
@@ -1848,6 +1850,8 @@
|
|
1848 |
"normalized": {
|
1849 |
"cer": 0.04187067364511227,
|
1850 |
"wer": 0.07035821321535607,
|
|
|
|
|
1851 |
"references": [
|
1852 |
"em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
|
1853 |
"o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
|
|
|
2 |
"raw": {
|
3 |
"cer": 0.03522598456164162,
|
4 |
"wer": 0.10547095318668923,
|
5 |
+
"non_numeric_samples_cer": 0.026064787928302146,
|
6 |
+
"non_numeric_samples_wer": 0.0929374773249486,
|
7 |
"references": [
|
8 |
"Em muitas outras cidades da Itália e no resto do mundo, especialmente na Polônia, arranjos similares foram feitos, permitindo o acompanhamento por um grande número de pessoas.",
|
9 |
"O escritório de gerência de emergência das Marianas do Norte disseram que não havia danos reportados no país.",
|
|
|
1850 |
"normalized": {
|
1851 |
"cer": 0.04187067364511227,
|
1852 |
"wer": 0.07035821321535607,
|
1853 |
+
"non_numeric_samples_cer": 0.035649540809211705,
|
1854 |
+
"non_numeric_samples_wer": 0.061505453245127836,
|
1855 |
"references": [
|
1856 |
"em muitas outras cidades da itália e no resto do mundo especialmente na polônia arranjos similares foram feitos permitindo o acompanhamento por um grande número de pessoas ",
|
1857 |
"o escritório de gerência de emergência das marianas do norte disseram que não havia danos reportados no país ",
|