sarpba
/

faster-base-hungarian_int8_V2

Model card Files Files and versions Community

sarpba commited on Dec 31, 2024

Commit

b3afaca

·

verified ·

1 Parent(s): 2b75e13

Create README.md

Files changed (1) hide show

README.md +20 -0

README.md ADDED Viewed

	@@ -0,0 +1,20 @@

+---
+language:
+- hu
+base_model:
+- sarpba/whisper-hu-base-finetuned-V2
+---
+# képzési információ
+A modell, egy újragondolt adatbázissal került kiképzésre.
+Az adatbázisból ki lettek véve:
+- a numerikus számok, ezért a modell az elhangzott számokat szövegesen fogja leírni
+- speciális karakterek, ezért ezeket is fonetikusan fogja leírni
+- mozaikszavak
+- nagybetűk
+Ezek miatt a változtatások miatt a WER elszállt kicsit, viszont a normalizált WER, tovább javult. A hipernormalizált WER vélhetően mégjobb lenne (ahhol a tesztataok is át lennének javítva a fentiek szerint).
+A képzés ezesetben a transformer könyvtár mintascriptjével történt: https://github.com/huggingface/transformers/tree/main/examples/pytorch/speech-recognition#whisper-model egyedi 2000 órás adatkészleten, ami most a CV17 train+validate spliteket is tartalmazta.