Spaces:
Runtime error
Runtime error
Upload 9 files
Browse files- .gitattributes +1 -0
- MUSTC_ROOT_marathi/en-mt/config_st.yaml +19 -0
- MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.en +8 -0
- MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.mt +8 -0
- MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.yaml +8 -0
- MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/wav/ted_1096.wav +3 -0
- MUSTC_ROOT_marathi/en-mt/fbank80.zip +3 -0
- MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.model +3 -0
- MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.txt +0 -0
- MUSTC_ROOT_marathi/en-mt/tst-COMMON_st.tsv +9 -0
.gitattributes
CHANGED
@@ -40,3 +40,4 @@ MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs me
|
|
40 |
MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
41 |
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
42 |
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
|
|
|
40 |
MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
41 |
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
42 |
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
43 |
+
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
MUSTC_ROOT_marathi/en-mt/config_st.yaml
ADDED
@@ -0,0 +1,19 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
bpe_tokenizer:
|
2 |
+
bpe: sentencepiece
|
3 |
+
sentencepiece_model: ./spm_unigram8000_st.model
|
4 |
+
input_channels: 1
|
5 |
+
input_feat_per_channel: 80
|
6 |
+
specaugment:
|
7 |
+
freq_mask_F: 27
|
8 |
+
freq_mask_N: 1
|
9 |
+
time_mask_N: 1
|
10 |
+
time_mask_T: 100
|
11 |
+
time_mask_p: 1.0
|
12 |
+
time_wrap_W: 0
|
13 |
+
transforms:
|
14 |
+
'*':
|
15 |
+
- utterance_cmvn
|
16 |
+
_train:
|
17 |
+
- utterance_cmvn
|
18 |
+
- specaugment
|
19 |
+
vocab_filename: spm_unigram8000_st.txt
|
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.en
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
Back in New York, I am the head of development for a non-profit called Robin Hood.
|
2 |
+
When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
|
3 |
+
Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
|
4 |
+
I remember my first fire.
|
5 |
+
I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
|
6 |
+
But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
|
7 |
+
When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
|
8 |
+
Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
|
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.mt
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
न्यूयॉर्कमध्ये परत, मी रॉबिन हूड नावाच्या ना-नफा संस्थेचा विकास प्रमुख आहे.
|
2 |
+
जेव्हा मी गरिबीशी लढत नाही, तेव्हा मी स्वयंसेवक अग्निशमन कंपनीचा सहाय्यक कर्णधार म्हणून आगीशी लढत आहे.
|
3 |
+
आता आमच्या गावात, जिथे स्वयंसेवक अत्यंत कुशल करिअर कर्मचार्यांना पूरक आहेत, तुम्हाला कोणतीही कृती करण्यासाठी आगीच्या ठिकाणी लवकर पोहोचावे लागेल.
|
4 |
+
मला माझी पहिली आग आठवते.
|
5 |
+
मी घटनास्थळावरील दुसरा स्वयंसेवक होतो, त्यामुळे मला आत जाण्याची चांगली संधी होती.
|
6 |
+
पण तरीही आमची नेमणूक काय असेल हे शोधण्यासाठी प्रभारी कर्णधाराकडे जाणे हे इतर स्वयंसेवकांविरुद्ध खरे पाऊल होते.
|
7 |
+
जेव्हा मला कॅप्टन सापडला, तेव्हा तो घरमालकाशी खूप आकर्षक संभाषण करत होता, ज्याला तिच्या आयुष्यातील सर्वात वाईट दिवसांपैकी एक होता.
|
8 |
+
इथेच, मध्यरात्री, ती बाहेर मुसळधार पावसात, छत्रीखाली, पायजम्यात, अनवाणी उभी होती, तर तिचं घर जळत होतं.
|
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.yaml
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
- {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
|
2 |
+
- {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
3 |
+
- {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
4 |
+
- {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
5 |
+
- {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
6 |
+
- {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
7 |
+
- {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
8 |
+
- {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/wav/ted_1096.wav
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
|
3 |
+
size 8990102
|
MUSTC_ROOT_marathi/en-mt/fbank80.zip
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
|
3 |
+
size 5242360
|
MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:7ba6aa66df08e7b5614deadfe3fc08d5473dc7dcf672d15134ce0e4db6dd99e1
|
3 |
+
size 458987
|
MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|
MUSTC_ROOT_marathi/en-mt/tst-COMMON_st.tsv
ADDED
@@ -0,0 +1,9 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
id audio n_frames tgt_text speaker
|
2 |
+
ted_1096_0 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:652123021:44928 140 कॅप्टनने मला ओवाळले. spk.1096
|
3 |
+
ted_1096_1 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:5396853429:272128 850 तो म्हणाला, "बेझोस, मला तू घरात जाण्याची गरज आहे. मला तू वरच्या मजल्यावर जाण्याची गरज आहे, आग ओलांडून जा, आणि या महिलेला एक जोडे जोडण्यासाठी तुझी गरज आहे." spk.1096
|
4 |
+
ted_1096_2 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:41827555529:6208 19 (हशा) spk.1096
|
5 |
+
ted_1096_3 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:46434264544:14848 46 मी शपथ घेतो. spk.1096
|
6 |
+
ted_1096_4 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:13281223497:447168 1397 त्यामुळे, मला नेमके काय वाटले होते ते नाही, पण मी निघालो -- पायऱ्या चढून, हॉलच्या खाली, 'वास्तविक' अग्निशमन दलाच्या मागे गेलो, ज्यांनी यावेळी आग विझवण्याचे काम पूर्ण केले होते, मास्टर बेडरूममध्ये जाण्यासाठी बुटांची एक जोडी. spk.1096
|
7 |
+
ted_1096_5 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:35969158042:152768 477 आता मला माहित आहे की तुम्ही काय विचार करत आहात, पण मी हिरो नाही. spk.1096
|
8 |
+
ted_1096_6 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:41927428403:194048 606 मी माझा पेलोड खाली खाली वाहून नेला जिथे मला समोरच्या दरवाज्याने माझा नेमेसिस आणि मौल्यवान कुत्रा भेटला. spk.1096
|
9 |
+
ted_1096_7 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:5964728808:236928 740 आम्ही आमचा खजिना बाहेरून घरमालकाकडे नेला, जेथे आश्चर्याची गोष्ट नाही की, त्याचे माझ्यापेक्षा जास्त लक्ष वेधले गेले. spk.1096
|