Spaces:
Runtime error
Runtime error
Upload 9 files
Browse files- .gitattributes +1 -0
- MUSTC_ROOT_tamil/en-tm/config_st.yaml +19 -0
- MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.en +8 -0
- MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.tm +8 -0
- MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.yaml +8 -0
- MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav +3 -0
- MUSTC_ROOT_tamil/en-tm/fbank80.zip +3 -0
- MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.model +3 -0
- MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.txt +0 -0
- MUSTC_ROOT_tamil/en-tm/tst-COMMON_st.tsv +9 -0
.gitattributes
CHANGED
@@ -39,3 +39,4 @@ MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs mer
|
|
39 |
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
40 |
MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
41 |
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
|
|
|
39 |
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
40 |
MUSTC_ROOT_nepali/en-ne/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
41 |
MUSTC_ROOT_gujrati/en-gj/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
42 |
+
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
MUSTC_ROOT_tamil/en-tm/config_st.yaml
ADDED
@@ -0,0 +1,19 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
bpe_tokenizer:
|
2 |
+
bpe: sentencepiece
|
3 |
+
sentencepiece_model: ./spm_unigram8000_st.model
|
4 |
+
input_channels: 1
|
5 |
+
input_feat_per_channel: 80
|
6 |
+
specaugment:
|
7 |
+
freq_mask_F: 27
|
8 |
+
freq_mask_N: 1
|
9 |
+
time_mask_N: 1
|
10 |
+
time_mask_T: 100
|
11 |
+
time_mask_p: 1.0
|
12 |
+
time_wrap_W: 0
|
13 |
+
transforms:
|
14 |
+
'*':
|
15 |
+
- utterance_cmvn
|
16 |
+
_train:
|
17 |
+
- utterance_cmvn
|
18 |
+
- specaugment
|
19 |
+
vocab_filename: spm_unigram8000_st.txt
|
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.en
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
Back in New York, I am the head of development for a non-profit called Robin Hood.
|
2 |
+
When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
|
3 |
+
Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
|
4 |
+
I remember my first fire.
|
5 |
+
I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
|
6 |
+
But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
|
7 |
+
When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
|
8 |
+
Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
|
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.tm
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
மீண்டும் நியூயார்க்கில், நான் ராபின் ஹூட் என்ற இலாப நோக்கற்ற நிறுவனத்தின் வளர்ச்சித் தலைவராக இருக்கிறேன்.
|
2 |
+
நான் வறுமையை எதிர்த்துப் போராடாதபோது, ஒரு தன்னார்வ தீயணைப்பு நிறுவனத்தின் உதவி கேப்டனாக நான் தீயை எதிர்த்துப் போராடுகிறேன்.
|
3 |
+
இப்போது எங்கள் நகரத்தில், தன்னார்வத் தொண்டர்கள் மிகவும் திறமையான தொழில் ஊழியர்களுக்குத் துணையாக இருப்பார்கள், எந்தவொரு செயலிலும் ஈடுபடுவதற்கு, நீங்கள் விரைவில் தீ விபத்து நடந்த இடத்திற்குச் செல்ல வேண்டும்.
|
4 |
+
எனது முதல் நெருப்பு எனக்கு நினைவிருக்கிறது.
|
5 |
+
காட்சியில் நான் இரண்டாவது தன்னார்வலராக இருந்தேன், அதனால் நான் உள்ளே செல்ல ஒரு நல்ல வாய்ப்பு இருந்தது.
|
6 |
+
ஆனால், எங்களின் பணிகள் என்னவாக இருக்கும் என்பதை அறிய, பொறுப்பான கேப்டனிடம் செல்வது மற்ற தன்னார்வலர்களுக்கு எதிரான உண்மையான தடயமாக இருந்தது.
|
7 |
+
நான் கேப்டனைக் கண்டுபிடித்தபோது, அவர் வீட்டு உரிமையாளருடன் மிகவும் ஈர்க்கக்கூடிய உரையாடலைக் கொண்டிருந்தார், அவர் நிச்சயமாக தனது வாழ்க்கையின் மோசமான நாட்களில் ஒன்றைக் கொண்டிருந்தார்.
|
8 |
+
இதோ, நள்ளிரவில், கொட்டும் மழையில், குடையின் கீழ், பைஜாமாவில், வெறுங்காலுடன், அவள் வீடு தீயில் எரிந்து கொண்டிருந்தபோது வெளியே நின்று கொண்டிருந்தாள்.
|
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/txt/tst-COMMON.yaml
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
- {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
|
2 |
+
- {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
3 |
+
- {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
4 |
+
- {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
5 |
+
- {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
6 |
+
- {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
7 |
+
- {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
8 |
+
- {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
MUSTC_ROOT_tamil/en-tm/data/tst-COMMON/wav/ted_1096.wav
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
|
3 |
+
size 8990102
|
MUSTC_ROOT_tamil/en-tm/fbank80.zip
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
|
3 |
+
size 5242360
|
MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:8111dca119a0b896f1a2f371fbe60682b804cf1e0f99281dd4cf410ea9e8bd29
|
3 |
+
size 500276
|
MUSTC_ROOT_tamil/en-tm/spm_unigram8000_st.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|
MUSTC_ROOT_tamil/en-tm/tst-COMMON_st.tsv
ADDED
@@ -0,0 +1,9 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
id audio n_frames tgt_text speaker
|
2 |
+
ted_1096_0 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:652123021:44928 140 கேப்டன் என்னை கைகாட்டினார். spk.1096
|
3 |
+
ted_1096_1 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:5396853429:272128 850 அவர் கூறினார், "பெசோஸ், நீங்கள் வீட்டிற்குள் செல்ல வேண்டும், நான் மாடிக்கு மேலே செல்ல வேண்டும், நெருப்பைக் கடந்து செல்ல வேண்டும், இந்த பெண்ணுக்கு ஒரு ஜோடி காலணிகளை எடுத்துக் கொடுக்க வேண்டும்." spk.1096
|
4 |
+
ted_1096_2 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:41827555529:6208 19 (சிரிப்பு) spk.1096
|
5 |
+
ted_1096_3 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:46434264544:14848 46 நான் சத்தியம் செய்கிறேன். spk.1096
|
6 |
+
ted_1096_4 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:13281223497:447168 1397 எனவே, நான் எதிர்பார்த்தது சரியாக இல்லை, ஆனால் நான் சென்றேன் -- படிக்கட்டுகளில் ஏறி, மண்டபத்தின் கீழே, 'உண்மையான' தீயணைப்பு வீரர்களைக் கடந்து, இந்த இடத்தில் தீயை அணைத்து, மாஸ்டர் பெட்ரூமிற்குச் சென்றேன். ஒரு ஜோடி காலணிகள். spk.1096
|
7 |
+
ted_1096_5 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:35969158042:152768 477 நீங்கள் என்ன நினைக்கிறீர்கள் என்று இப்போது எனக்குத் தெரியும், ஆனால் நான் ஹீரோ இல்லை. spk.1096
|
8 |
+
ted_1096_6 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:41927428403:194048 606 நான் எனது பேலோடை மீண்டும் கீழே எடுத்துச் சென்றேன், அங்கு என் எதிரியையும் விலைமதிப்பற்ற நாயையும் முன் வாசலில் சந்தித்தேன். spk.1096
|
9 |
+
ted_1096_7 /home/deepakprasad/nlp_code/Tamil_MUSTC/en-tm/fbank80.zip:5964728808:236928 740 நாங்கள் எங்கள் பொக்கிஷங்களை வீட்டின் உரிமையாளரிடம் கொண்டு சென்றோம், அங்கு என்னுடையதை விட அவர் அதிக கவனத்தைப் பெற்றதில் ஆச்சரியமில்லை. spk.1096
|