Spaces:
Runtime error
Runtime error
Upload 10 files
Browse files- .gitattributes +1 -0
- MUSTC_ROOT_bengali/en-bn/config_st.yaml +19 -0
- MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.bn +8 -0
- MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.en +8 -0
- MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.yaml +8 -0
- MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav +3 -0
- MUSTC_ROOT_bengali/en-bn/fbank80.zip +3 -0
- MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.model +3 -0
- MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.txt +0 -0
- MUSTC_ROOT_bengali/en-bn/tst-COMMON_st.tsv +9 -0
- app.py +6 -1
.gitattributes
CHANGED
@@ -36,3 +36,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
36 |
MUSTC_ROOT_french/en-fr/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
37 |
MUSTC_ROOT_hindi/en-hi/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
38 |
MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
|
|
|
36 |
MUSTC_ROOT_french/en-fr/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
37 |
MUSTC_ROOT_hindi/en-hi/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
38 |
MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
39 |
+
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
|
MUSTC_ROOT_bengali/en-bn/config_st.yaml
ADDED
@@ -0,0 +1,19 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
bpe_tokenizer:
|
2 |
+
bpe: sentencepiece
|
3 |
+
sentencepiece_model: ./spm_unigram8000_st.model
|
4 |
+
input_channels: 1
|
5 |
+
input_feat_per_channel: 80
|
6 |
+
specaugment:
|
7 |
+
freq_mask_F: 27
|
8 |
+
freq_mask_N: 1
|
9 |
+
time_mask_N: 1
|
10 |
+
time_mask_T: 100
|
11 |
+
time_mask_p: 1.0
|
12 |
+
time_wrap_W: 0
|
13 |
+
transforms:
|
14 |
+
'*':
|
15 |
+
- utterance_cmvn
|
16 |
+
_train:
|
17 |
+
- utterance_cmvn
|
18 |
+
- specaugment
|
19 |
+
vocab_filename: spm_unigram8000_st.txt
|
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.bn
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
নিউ ইয়র্কে ফিরে, আমি রবিন হুড নামে একটি অলাভজনক উন্নয়নের প্রধান।
|
2 |
+
যখন আমি দারিদ্র্যের সাথে লড়াই করছি না, আমি একটি স্বেচ্ছাসেবক ফায়ার কোম্পানির সহকারী ক্যাপ্টেন হিসাবে আগুনের বিরুদ্ধে লড়াই করছি।
|
3 |
+
এখন আমাদের শহরে, যেখানে স্বেচ্ছাসেবকরা একটি উচ্চ দক্ষ কর্মজীবনের কর্মীদের পরিপূরক করে, আপনাকে যেকোন কাজ করার জন্য খুব তাড়াতাড়ি আগুনের দৃশ্যে যেতে হবে।
|
4 |
+
আমার প্রথম আগুনের কথা মনে আছে।
|
5 |
+
আমি ঘটনাস্থলের দ্বিতীয় স্বেচ্ছাসেবক ছিলাম, তাই আমার প্রবেশ করার একটি খুব ভাল সুযোগ ছিল।
|
6 |
+
কিন্তু তারপরও অন্যান্য স্বেচ্ছাসেবকদের বিরুদ্ধে আমাদের অ্যাসাইনমেন্টগুলি কী হবে তা খুঁজে বের করার জন্য দায়িত্বে থাকা ক্যাপ্টেনের কাছে যাওয়া ছিল একটি আসল পথ।
|
7 |
+
যখন আমি ক্যাপ্টেনকে খুঁজে পেলাম, তখন তিনি বাড়ির মালিকের সাথে খুব আকর্ষক কথোপকথন করছিলেন, যিনি অবশ্যই তার জীবনের সবচেয়ে খারাপ দিনগুলির মধ্যে একটি ছিলেন।
|
8 |
+
এই ছিল, মাঝরাতে, সে বাইরে অঝোর ধারায় বৃষ্টির মধ্যে, ছাতার নীচে, পায়জামা পরে, খালি পায়ে দাঁড়িয়ে ছিল, যখন তার ঘর আগুনে জ্বলছিল।
|
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.en
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
Back in New York, I am the head of development for a non-profit called Robin Hood.
|
2 |
+
When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
|
3 |
+
Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
|
4 |
+
I remember my first fire.
|
5 |
+
I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
|
6 |
+
But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
|
7 |
+
When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
|
8 |
+
Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
|
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.yaml
ADDED
@@ -0,0 +1,8 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
- {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
|
2 |
+
- {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
3 |
+
- {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
4 |
+
- {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
5 |
+
- {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
6 |
+
- {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
7 |
+
- {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
8 |
+
- {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
|
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
|
3 |
+
size 8990102
|
MUSTC_ROOT_bengali/en-bn/fbank80.zip
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
|
3 |
+
size 5242360
|
MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:892dd0398e561af3bd035798ff1682f9a35c2736378e041922a46e111c3d7a72
|
3 |
+
size 467219
|
MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|
MUSTC_ROOT_bengali/en-bn/tst-COMMON_st.tsv
ADDED
@@ -0,0 +1,9 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
id audio n_frames tgt_text speaker
|
2 |
+
ted_1096_0 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:652123021:44928 140 ক্যাপ্টেন আমাকে হাত নাড়লেন। spk.1096
|
3 |
+
ted_1096_1 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:5396853429:272128 850 তিনি বললেন, "বেজোস, আমার তোমাকে ঘরে ঢুকতে হবে। আমার তোমাকে উপরের তলায় যেতে হবে, আগুন অতিক্রম করতে হবে এবং এই মহিলাকে একজোড়া জুতো পেতে আমার তোমার প্রয়োজন।" spk.1096
|
4 |
+
ted_1096_2 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:41827555529:6208 19 (হাসি) spk.1096
|
5 |
+
ted_1096_3 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:46434264544:14848 46 আমি শপথ করছি। spk.1096
|
6 |
+
ted_1096_4 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:13281223497:447168 1397 তাই, আমি যা আশা করছিলাম ঠিক তা নয়, তবে আমি চলে গেলাম -- সিঁড়ি বেয়ে, হলের নিচে, 'আসল' দমকল কর্মীদের পেরিয়ে, যারা এই মুহুর্তে আগুন নেভানোর জন্য অনেকটাই সম্পন্ন করেছে, মাস্টার বেডরুমে এক জোড়া জুতো. spk.1096
|
7 |
+
ted_1096_5 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:35969158042:152768 477 এখন আমি জানি আপনি কি ভাবছেন, কিন্তু আমি কোন নায়ক নই। spk.1096
|
8 |
+
ted_1096_6 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:41927428403:194048 606 আমি আমার পেলোডটি নীচে নিয়ে গিয়েছিলাম যেখানে সামনের দরজায় আমার নেমেসিস এবং মূল্যবান কুকুরটির সাথে দেখা হয়েছিল। spk.1096
|
9 |
+
ted_1096_7 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:5964728808:236928 740 আমরা আমাদের ধন-সম্পদ বাইরে বাড়ির মালিকের কাছে নিয়ে গিয়েছিলাম, যেখানে আশ্চর্যজনকভাবে তিনি আমার চেয়ে অনেক বেশি মনোযোগ পেয়েছিলেন। spk.1096
|
app.py
CHANGED
@@ -78,6 +78,11 @@ def run_my_code(input_text, language):
|
|
78 |
data_root="./MUSTC_ROOT_german/en-de/"
|
79 |
d_r="MUSTC_ROOT_german/"
|
80 |
yam="./MUSTC_ROOT_german/en-de/data/tst-COMMON/txt/tst-COMMON.yaml"
|
|
|
|
|
|
|
|
|
|
|
81 |
|
82 |
|
83 |
|
@@ -135,7 +140,7 @@ output_textbox = gr.outputs.Textbox(label="The Translated Text is:")
|
|
135 |
# Create a Gradio interface
|
136 |
iface = gr.Interface(
|
137 |
fn=run_my_code,
|
138 |
-
inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American/British English Accent)..."), gr.inputs.Radio(["Hindi", "French", "German"], label="Language")],
|
139 |
outputs=output_textbox,
|
140 |
title="English Speech to Text Translator")
|
141 |
|
|
|
78 |
data_root="./MUSTC_ROOT_german/en-de/"
|
79 |
d_r="MUSTC_ROOT_german/"
|
80 |
yam="./MUSTC_ROOT_german/en-de/data/tst-COMMON/txt/tst-COMMON.yaml"
|
81 |
+
if(language=="Bengali"):
|
82 |
+
model_checkpoint = "./models/bengali_model.pt"
|
83 |
+
data_root="./MUSTC_ROOT_bengali/en-bn/"
|
84 |
+
d_r="MUSTC_ROOT_bengali/"
|
85 |
+
yam="./MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.yaml"
|
86 |
|
87 |
|
88 |
|
|
|
140 |
# Create a Gradio interface
|
141 |
iface = gr.Interface(
|
142 |
fn=run_my_code,
|
143 |
+
inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American/British English Accent)..."), gr.inputs.Radio(["Hindi", "Bengali", "French", "German"], label="Language")],
|
144 |
outputs=output_textbox,
|
145 |
title="English Speech to Text Translator")
|
146 |
|