sarpba commited on
Commit
b3afaca
·
verified ·
1 Parent(s): 2b75e13

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +20 -0
README.md ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - hu
4
+ base_model:
5
+ - sarpba/whisper-hu-base-finetuned-V2
6
+ ---
7
+ # képzési információ
8
+
9
+ A modell, egy újragondolt adatbázissal került kiképzésre.
10
+
11
+ Az adatbázisból ki lettek véve:
12
+
13
+ - a numerikus számok, ezért a modell az elhangzott számokat szövegesen fogja leírni
14
+ - speciális karakterek, ezért ezeket is fonetikusan fogja leírni
15
+ - mozaikszavak
16
+ - nagybetűk
17
+
18
+ Ezek miatt a változtatások miatt a WER elszállt kicsit, viszont a normalizált WER, tovább javult. A hipernormalizált WER vélhetően mégjobb lenne (ahhol a tesztataok is át lennének javítva a fentiek szerint).
19
+
20
+ A képzés ezesetben a transformer könyvtár mintascriptjével történt: https://github.com/huggingface/transformers/tree/main/examples/pytorch/speech-recognition#whisper-model egyedi 2000 órás adatkészleten, ami most a CV17 train+validate spliteket is tartalmazta.