balaramas commited on
Commit
cf148ed
1 Parent(s): d3e410d

Upload 9 files

Browse files
.gitattributes CHANGED
@@ -40,3 +40,4 @@ MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs me
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
41
  MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
42
  MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
 
 
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
41
  MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
42
  MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
43
+ MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
MUSTC_ROOT_marathi/en-mt/config_st.yaml ADDED
@@ -0,0 +1,19 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ bpe_tokenizer:
2
+ bpe: sentencepiece
3
+ sentencepiece_model: ./spm_unigram8000_st.model
4
+ input_channels: 1
5
+ input_feat_per_channel: 80
6
+ specaugment:
7
+ freq_mask_F: 27
8
+ freq_mask_N: 1
9
+ time_mask_N: 1
10
+ time_mask_T: 100
11
+ time_mask_p: 1.0
12
+ time_wrap_W: 0
13
+ transforms:
14
+ '*':
15
+ - utterance_cmvn
16
+ _train:
17
+ - utterance_cmvn
18
+ - specaugment
19
+ vocab_filename: spm_unigram8000_st.txt
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.en ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ Back in New York, I am the head of development for a non-profit called Robin Hood.
2
+ When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
3
+ Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
4
+ I remember my first fire.
5
+ I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
6
+ But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
7
+ When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
8
+ Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.mt ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ न्यूयॉर्कमध्ये परत, मी रॉबिन हूड नावाच्या ना-नफा संस्थेचा विकास प्रमुख आहे.
2
+ जेव्हा मी गरिबीशी लढत नाही, तेव्हा मी स्वयंसेवक अग्निशमन कंपनीचा सहाय्यक कर्णधार म्हणून आगीशी लढत आहे.
3
+ आता आमच्या गावात, जिथे स्वयंसेवक अत्यंत कुशल करिअर कर्मचार्‍यांना पूरक आहेत, तुम्हाला कोणतीही कृती करण्यासाठी आगीच्या ठिकाणी लवकर पोहोचावे लागेल.
4
+ मला माझी पहिली आग आठवते.
5
+ मी घटनास्थळावरील दुसरा स्वयंसेवक होतो, त्यामुळे मला आत जाण्याची चांगली संधी होती.
6
+ पण तरीही आमची नेमणूक काय असेल हे शोधण्यासाठी प्रभारी कर्णधाराकडे जाणे हे इतर स्वयंसेवकांविरुद्ध खरे पाऊल होते.
7
+ जेव्हा मला कॅप्टन सापडला, तेव्हा तो घरमालकाशी खूप आकर्षक संभाषण करत होता, ज्याला तिच्या आयुष्यातील सर्वात वाईट दिवसांपैकी एक होता.
8
+ इथेच, मध्यरात्री, ती बाहेर मुसळधार पावसात, छत्रीखाली, पायजम्यात, अनवाणी उभी होती, तर तिचं घर जळत होतं.
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/txt/tst-COMMON.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ - {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
2
+ - {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
3
+ - {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
4
+ - {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
5
+ - {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
6
+ - {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
7
+ - {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
8
+ - {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
MUSTC_ROOT_marathi/en-mt/data/tst-COMMON/wav/ted_1096.wav ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
3
+ size 8990102
MUSTC_ROOT_marathi/en-mt/fbank80.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
3
+ size 5242360
MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7ba6aa66df08e7b5614deadfe3fc08d5473dc7dcf672d15134ce0e4db6dd99e1
3
+ size 458987
MUSTC_ROOT_marathi/en-mt/spm_unigram8000_st.txt ADDED
The diff for this file is too large to render. See raw diff
 
MUSTC_ROOT_marathi/en-mt/tst-COMMON_st.tsv ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ id audio n_frames tgt_text speaker
2
+ ted_1096_0 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:652123021:44928 140 कॅप्टनने मला ओवाळले. spk.1096
3
+ ted_1096_1 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:5396853429:272128 850 तो म्हणाला, "बेझोस, मला तू घरात जाण्याची गरज आहे. मला तू वरच्या मजल्यावर जाण्याची गरज आहे, आग ओलांडून जा, आणि या महिलेला एक जोडे जोडण्यासाठी तुझी गरज आहे." spk.1096
4
+ ted_1096_2 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:41827555529:6208 19 (हशा) spk.1096
5
+ ted_1096_3 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:46434264544:14848 46 मी शपथ घेतो. spk.1096
6
+ ted_1096_4 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:13281223497:447168 1397 त्यामुळे, मला नेमके काय वाटले होते ते नाही, पण मी निघालो -- पायऱ्या चढून, हॉलच्या खाली, 'वास्तविक' अग्निशमन दलाच्या मागे गेलो, ज्यांनी यावेळी आग विझवण्याचे काम पूर्ण केले होते, मास्टर बेडरूममध्ये जाण्यासाठी बुटांची एक जोडी. spk.1096
7
+ ted_1096_5 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:35969158042:152768 477 आता मला माहित आहे की तुम्ही काय विचार करत आहात, पण मी हिरो नाही. spk.1096
8
+ ted_1096_6 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:41927428403:194048 606 मी माझा पेलोड खाली खाली वाहून नेला जिथे मला समोरच्या दरवाज्याने माझा नेमेसिस आणि मौल्यवान कुत्रा भेटला. spk.1096
9
+ ted_1096_7 /home/deepakprasad/nlp_code/Marathi_MUSTC/en-mt/fbank80.zip:5964728808:236928 740 आम्ही आमचा खजिना बाहेरून घरमालकाकडे नेला, जेथे आश्चर्याची गोष्ट नाही की, त्याचे माझ्यापेक्षा जास्त लक्ष वेधले गेले. spk.1096