File size: 3,604 Bytes
4b7b6f5
c28b45a
4b7b6f5
1f30811
 
 
 
c28b45a
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4b7b6f5
 
96269f9
 
 
 
 
4aae976
96269f9
 
 
9081c0b
96269f9
9081c0b
 
96269f9
9081c0b
96269f9
9081c0b
96269f9
9081c0b
 
 
96269f9
9081c0b
96269f9
9081c0b
 
854c77a
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
96269f9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
---
base_model: utter-project/mHuBERT-147
license: cc-by-nc-4.0
language: 
  - uk
tags:
- automatic-speech-recognition
datasets:
  - espnet/yodas2
metrics:
  - wer
model-index:
  - name: w2v-bert-2.0-uk-v2.1
    results:
      - task:
          name: Automatic Speech Recognition
          type: automatic-speech-recognition
        dataset:
          name: common_voice_10_0
          type: common_voice_10_0
          config: uk
          split: test
          args: uk
        metrics:
          - name: Wer
            type: wer
            value: 0.2035
---

# HuBERT for Ukrainian


## Community

- Discord: https://bit.ly/discord-uds
- Speech Recognition: https://t.me/speech_recognition_uk
- Speech Synthesis: https://t.me/speech_synthesis_uk

## Install

```text
uv venv --python 3.12

source .venv/bin/activate

uv pip install -r requirements.txt

# in development mode
uv pip install -r requirements-dev.txt
```

## Usage

```text
python run_demo.py

---
Predictions:
['тема прояку не люблять говорит офіійні жерела гнштабі і мінорони цехімічна зроя окупанти же тривали час використовуютьою заборонену']
References:
['тема про яку не люблять говорити офіційні джерела у генштабі і міноборони це хімічна зброя окупанти вже тривалий час використовують хімічну зброю заборонену']
---
---
Predictions:
['всіма конвенціями якщо спочатку це були гранати здороні ту перфіксують випадки застосування']
References:
['всіма конвенціями якщо спочатку це були гранати з дронів то тепер фіксують випадки застосування']
---
---
Predictions:
['хіммічних снарядів при чому складу трон речовони різніж насідки для нших військових теж різні']
References:
['хімічних снарядів причому склад отруйної речовони різний а отже й наслідки для наших військових теж різні']
---
---
Predictions:
['використовувує на фронті все що має і хімічне збронивині тактож щи маємо справило розбиралася маріямоганесян']
References:
['використовує на фронті все що має і хімічна зброя не вийняток тож з чим маємо справу розбиралася марія моганисян']
---
---
Predictions:
['двох тисяч випадків застосування росіянами боєприпасів зпоряджених набезпечними хімічними речовинами']
References:
['двох тисяч випадків застосування росіянами боєприпасів споряджених небезпечними хімічними речовинами']
---
---
Predictions:
['на всі писані норми маріямогонесян олександр моторний спецкор марафон єдині новини']
References:
['на всі писані норми марія моганисян олександр моторний спецкор марафон єдині новини']
---
Final:
WER: 0.5 | CER: 0.1198
```