balaramas commited on
Commit
20ed115
1 Parent(s): d9e6fd6

Upload 9 files

Browse files
.gitattributes CHANGED
@@ -38,3 +38,4 @@ MUSTC_ROOT_hindi/en-hi/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merg
38
  MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
39
  MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
 
 
38
  MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
39
  MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
41
+ MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
MUSTC_ROOT_gujrati/en-gj/config_st.yaml ADDED
@@ -0,0 +1,19 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ bpe_tokenizer:
2
+ bpe: sentencepiece
3
+ sentencepiece_model: ./spm_unigram8000_st.model
4
+ input_channels: 1
5
+ input_feat_per_channel: 80
6
+ specaugment:
7
+ freq_mask_F: 27
8
+ freq_mask_N: 1
9
+ time_mask_N: 1
10
+ time_mask_T: 100
11
+ time_mask_p: 1.0
12
+ time_wrap_W: 0
13
+ transforms:
14
+ '*':
15
+ - utterance_cmvn
16
+ _train:
17
+ - utterance_cmvn
18
+ - specaugment
19
+ vocab_filename: spm_unigram8000_st.txt
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/txt/tst-COMMON.en ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ Back in New York, I am the head of development for a non-profit called Robin Hood.
2
+ When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
3
+ Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
4
+ I remember my first fire.
5
+ I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
6
+ But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
7
+ When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
8
+ Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/txt/tst-COMMON.gj ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ ન્યૂ યોર્કમાં પાછા, હું રોબિન હૂડ નામના બિન-લાભકારી માટે વિકાસનો વડા છું.
2
+ જ્યારે હું ગરીબી સામે લડતો નથી, ત્યારે હું સ્વયંસેવક ફાયર કંપનીના સહાયક કેપ્ટન તરીકે આગ સામે લડી રહ્યો છું.
3
+ હવે અમારા નગરમાં, જ્યાં સ્વયંસેવકો ઉચ્ચ કુશળ કારકિર્દી સ્ટાફની પૂર્તિ કરે છે, તમારે કોઈપણ ક્રિયામાં જવા માટે ખૂબ વહેલા આગના સ્થળે પહોંચવું પડશે.
4
+ મને મારી પહેલી આગ યાદ છે.
5
+ હું દ્રશ્ય પરનો બીજો સ્વયંસેવક હતો, તેથી હું અંદર જવાની એક સુંદર તક હતી.
6
+ પરંતુ તેમ છતાં અમારી સોંપણીઓ શું હશે તે જાણવા ઈન્ચાર્જ કેપ્ટન પાસે જવું એ અન્ય સ્વયંસેવકો સામે વાસ્તવિક પગપેસારો હતો.
7
+ જ્યારે હું કેપ્ટનને મળ્યો, ત્યારે તે ઘરમાલિક સાથે ખૂબ જ આકર્ષક વાતચીત કરી રહ્યો હતો, જે ચોક્કસપણે તેના જીવનના સૌથી ખરાબ દિવસોમાંથી એક પસાર કરી રહ્યો હતો.
8
+ તે અહીં હતું, મધ્યરાત્રિએ, તેણી બહાર ધોધમાર વરસાદમાં, એક છત્ર હેઠળ, તેના પાયજામામાં, ઉઘાડપગું ઉભી હતી, જ્યારે તેનું ઘર આગમાં હતું.
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/txt/tst-COMMON.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ - {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
2
+ - {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
3
+ - {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
4
+ - {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
5
+ - {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
6
+ - {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
7
+ - {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
8
+ - {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
3
+ size 8990102
MUSTC_ROOT_gujrati/en-gj/fbank80.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
3
+ size 5242360
MUSTC_ROOT_gujrati/en-gj/spm_unigram8000_st.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:af23c356de872a60a32cfd6eacd7d5313934d7252b1b4ccc011bfc6992c2e904
3
+ size 454913
MUSTC_ROOT_gujrati/en-gj/spm_unigram8000_st.txt ADDED
The diff for this file is too large to render. See raw diff
 
MUSTC_ROOT_gujrati/en-gj/tst-COMMON_st.tsv ADDED
The diff for this file is too large to render. See raw diff