balaramas commited on
Commit
4095b0b
1 Parent(s): 9decf66

Upload 9 files

Browse files
.gitattributes CHANGED
@@ -39,3 +39,4 @@ MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs mer
39
  MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
41
  MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
 
 
39
  MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
40
  MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
41
  MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
42
+ MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
MUSTC_ROOT_tamil/en-tm/config_st.yaml ADDED
@@ -0,0 +1,19 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ bpe_tokenizer:
2
+ bpe: sentencepiece
3
+ sentencepiece_model: ./spm_unigram8000_st.model
4
+ input_channels: 1
5
+ input_feat_per_channel: 80
6
+ specaugment:
7
+ freq_mask_F: 27
8
+ freq_mask_N: 1
9
+ time_mask_N: 1
10
+ time_mask_T: 100
11
+ time_mask_p: 1.0
12
+ time_wrap_W: 0
13
+ transforms:
14
+ '*':
15
+ - utterance_cmvn
16
+ _train:
17
+ - utterance_cmvn
18
+ - specaugment
19
+ vocab_filename: spm_unigram8000_st.txt
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.en ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ Back in New York, I am the head of development for a non-profit called Robin Hood.
2
+ When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
3
+ Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
4
+ I remember my first fire.
5
+ I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
6
+ But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
7
+ When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
8
+ Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.tm ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ மீண்டும் நியூயார்க்கில், நான் ராபின் ஹூட் என்ற இலாப நோக்கற்ற நிறுவனத்தின் வளர்ச்சித் தலைவராக இருக்கிறேன்.
2
+ நான் வறுமையை எதிர்த்துப் போராடாதபோது, ​​ஒரு தன்னார்வ தீயணைப்பு நிறுவனத்தின் உதவி கேப்டனாக நான் தீயை எதிர்த்துப் போராடுகிறேன்.
3
+ இப்போது எங்கள் நகரத்தில், தன்னார்வத் தொண்டர்கள் மிகவும் திறமையான தொழில் ஊழியர்களுக்குத் துணையாக இருப்பார்கள், எந்தவொரு செயலிலும் ஈடுபடுவதற்கு, நீங்கள் விரைவில் தீ விபத்து நடந்த இடத்திற்குச் செல்ல வேண்டும்.
4
+ எனது முதல் நெருப்பு எனக்கு நினைவிருக்கிறது.
5
+ காட்சியில் நான் இரண்டாவது தன்னார்வலராக இருந்தேன், அதனால் நான் உள்ளே செல்ல ஒரு நல்ல வாய்ப்பு இருந்தது.
6
+ ஆனால், எங்களின் பணிகள் என்னவாக இருக்கும் என்பதை அறிய, பொறுப்பான கேப்டனிடம் செல்வது மற்ற தன்னார்வலர்களுக்கு எதிரான உண்மையான தடயமாக இருந்தது.
7
+ நான் கேப்டனைக் கண்டுபிடித்தபோது, ​​​​அவர் வீட்டு உரிமையாளருடன் மிகவும் ஈர்க்கக்கூடிய உரையாடலைக் கொண்டிருந்தார், அவர் நிச்சயமாக தனது வாழ்க்கையின் மோசமான நாட்களில் ஒன்றைக் கொண்டிருந்தார்.
8
+ இதோ, நள்ளிரவில், கொட்டும் மழையில், குடையின் கீழ், பைஜாமாவில், வெறுங்காலுடன், அவள் வீடு தீயில் எரிந்து கொண்டிருந்தபோது வெளியே நின்று கொண்டிருந்தாள்.
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ - {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
2
+ - {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
3
+ - {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
4
+ - {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
5
+ - {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
6
+ - {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
7
+ - {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
8
+ - {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
3
+ size 8990102
MUSTC_ROOT_tamil/en-tm/fbank80.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
3
+ size 5242360
MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8111dca119a0b896f1a2f371fbe60682b804cf1e0f99281dd4cf410ea9e8bd29
3
+ size 500276
MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.txt ADDED
The diff for this file is too large to render. See raw diff
 
MUSTC_ROOT_tamil/en-tm/tst-COMMON_st.tsv ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ id audio n_frames tgt_text speaker
2
+ ted_1096_0 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:652123021:44928 140 கேப்டன் என்னை கைகாட்டினார். spk.1096
3
+ ted_1096_1 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:5396853429:272128 850 அவர் கூறினார், "பெசோஸ், நீங்கள் வீட்டிற்குள் செல்ல வேண்டும், நான் மாடிக்கு மேலே செல்ல வேண்டும், நெருப்பைக் கடந்து செல்ல வேண்டும், இந்த பெண்ணுக்கு ஒரு ஜோடி காலணிகளை எடுத்துக் கொடுக்க வேண்டும்." spk.1096
4
+ ted_1096_2 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:41827555529:6208 19 (சிரிப்பு) spk.1096
5
+ ted_1096_3 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:46434264544:14848 46 நான் சத்தியம் செய்கிறேன். spk.1096
6
+ ted_1096_4 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:13281223497:447168 1397 எனவே, நான் எதிர்பார்த்தது சரியாக இல்லை, ஆனால் நான் சென்றேன் -- படிக்கட்டுகளில் ஏறி, மண்டபத்தின் கீழே, 'உண்மையான' தீயணைப்பு வீரர்களைக் கடந்து, இந்த இடத்தில் தீயை அணைத்து, மாஸ்டர் பெட்ரூமிற்குச் சென்றேன். ஒரு ஜோடி காலணிகள். spk.1096
7
+ ted_1096_5 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:35969158042:152768 477 நீங்கள் என்ன நினைக்கிறீர்கள் என்று இப்போது எனக்குத் தெரியும், ஆனால் நான் ஹீரோ இல்லை. spk.1096
8
+ ted_1096_6 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:41927428403:194048 606 நான் எனது பேலோடை மீண்டும் கீழே எடுத்துச் சென்றேன், அங்கு என் எதிரியையும் விலைமதிப்பற்ற நாயையும் முன் வாசலில் சந்தித்தேன். spk.1096
9
+ ted_1096_7 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:5964728808:236928 740 நாங்கள் எங்கள் பொக்கிஷங்களை வீட்டின் உரிமையாளரிடம் கொண்டு சென்றோம், அங்கு என்னுடையதை விட அவர் அதிக கவனத்தைப் பெற்றதில் ஆச்சரியமில்லை. spk.1096