balaramas commited on
Commit
832785c
1 Parent(s): 9edce92

Upload 10 files

Browse files
.gitattributes CHANGED
@@ -36,3 +36,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
36
  MUSTC_ROOT_french/en-fr/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
37
  MUSTC_ROOT_hindi/en-hi/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
38
  MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
 
 
36
  MUSTC_ROOT_french/en-fr/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
37
  MUSTC_ROOT_hindi/en-hi/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
38
  MUSTC_ROOT_german/en-de/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
39
+ MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav filter=lfs diff=lfs merge=lfs -text
MUSTC_ROOT_bengali/en-bn/config_st.yaml ADDED
@@ -0,0 +1,19 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ bpe_tokenizer:
2
+ bpe: sentencepiece
3
+ sentencepiece_model: ./spm_unigram8000_st.model
4
+ input_channels: 1
5
+ input_feat_per_channel: 80
6
+ specaugment:
7
+ freq_mask_F: 27
8
+ freq_mask_N: 1
9
+ time_mask_N: 1
10
+ time_mask_T: 100
11
+ time_mask_p: 1.0
12
+ time_wrap_W: 0
13
+ transforms:
14
+ '*':
15
+ - utterance_cmvn
16
+ _train:
17
+ - utterance_cmvn
18
+ - specaugment
19
+ vocab_filename: spm_unigram8000_st.txt
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.bn ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ নিউ ইয়র্কে ফিরে, আমি রবিন হুড নামে একটি অলাভজনক উন্নয়নের প্রধান।
2
+ যখন আমি দারিদ্র্যের সাথে লড়াই করছি না, আমি একটি স্বেচ্ছাসেবক ফায়ার কোম্পানির সহকারী ক্যাপ্টেন হিসাবে আগুনের বিরুদ্ধে লড়াই করছি।
3
+ এখন আমাদের শহরে, যেখানে স্বেচ্ছাসেবকরা একটি উচ্চ দক্ষ কর্মজীবনের কর্মীদের পরিপূরক করে, আপনাকে যেকোন কাজ করার জন্য খুব তাড়াতাড়ি আগুনের দৃশ্যে যেতে হবে।
4
+ আমার প্রথম আগুনের কথা মনে আছে।
5
+ আমি ঘটনাস্থলের দ্বিতীয় স্বেচ্ছাসেবক ছিলাম, তাই আমার প্রবেশ করার একটি খুব ভাল সুযোগ ছিল।
6
+ কিন্তু তারপরও অন্যান্য স্বেচ্ছাসেবকদের বিরুদ্ধে আমাদের অ্যাসাইনমেন্টগুলি কী হবে তা খুঁজে বের করার জন্য দায়িত্বে থাকা ক্যাপ্টেনের কাছে যাওয়া ছিল একটি আসল পথ।
7
+ যখন আমি ক্যাপ্টেনকে খুঁজে পেলাম, তখন তিনি বাড়ির মালিকের সাথে খুব আকর্ষক কথোপকথন করছিলেন, যিনি অবশ্যই তার জীবনের সবচেয়ে খারাপ দিনগুলির মধ্যে একটি ছিলেন।
8
+ এই ছিল, মাঝরাতে, সে বাইরে অঝোর ধারায় বৃষ্টির মধ্যে, ছাতার নীচে, পায়জামা পরে, খালি পায়ে দাঁড়িয়ে ছিল, যখন তার ঘর আগুনে জ্বলছিল।
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.en ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ Back in New York, I am the head of development for a non-profit called Robin Hood.
2
+ When I'm not fighting poverty, I'm fighting fires as the assistant captain of a volunteer fire company.
3
+ Now in our town, where the volunteers supplement a highly skilled career staff, you have to get to the fire scene pretty early to get in on any action.
4
+ I remember my first fire.
5
+ I was the second volunteer on the scene, so there was a pretty good chance I was going to get in.
6
+ But still it was a real footrace against the other volunteers to get to the captain in charge to find out what our assignments would be.
7
+ When I found the captain, he was having a very engaging conversation with the homeowner, who was surely having one of the worst days of her life.
8
+ Here it was, the middle of the night, she was standing outside in the pouring rain, under an umbrella, in her pajamas, barefoot, while her house was in flames.
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.yaml ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ - {duration: 5.0, offset: 0.0, rW: 17, uW: 0, speaker_id: spk.1096, wav: test.wav}
2
+ - {duration: 5.160000, offset: 20.290000, rW: 17, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
3
+ - {duration: 8.110000, offset: 25.930000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
4
+ - {duration: 1.560000, offset: 34.920000, rW: 5, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
5
+ - {duration: 4.180000, offset: 36.730000, rW: 21, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
6
+ - {duration: 5.580000, offset: 41.880000, rW: 26, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
7
+ - {duration: 8.610001, offset: 48.309999, rW: 27, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
8
+ - {duration: 9.680000, offset: 57.510000, rW: 29, uW: 0, speaker_id: spk.1096, wav: ted_1096.wav}
MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/wav/ted_1096.wav ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:69a122c3ad89320ec24cad84b622a01f26c3138b3e5869dc033e65bd0ab73fe1
3
+ size 8990102
MUSTC_ROOT_bengali/en-bn/fbank80.zip ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0bef03a45d7514d5018c4de30d352c736359248e6e8d70d586796aa32b30f4e2
3
+ size 5242360
MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:892dd0398e561af3bd035798ff1682f9a35c2736378e041922a46e111c3d7a72
3
+ size 467219
MUSTC_ROOT_bengali/en-bn/spm_unigram8000_st.txt ADDED
The diff for this file is too large to render. See raw diff
 
MUSTC_ROOT_bengali/en-bn/tst-COMMON_st.tsv ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ id audio n_frames tgt_text speaker
2
+ ted_1096_0 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:652123021:44928 140 ক্যাপ্টেন আমাকে হাত নাড়লেন। spk.1096
3
+ ted_1096_1 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:5396853429:272128 850 তিনি বললেন, "বেজোস, আমার তোমাকে ঘরে ঢুকতে হবে। আমার তোমাকে উপরের তলায় যেতে হবে, আগুন অতিক্রম করতে হবে এবং এই মহিলাকে একজোড়া জুতো পেতে আমার তোমার প্রয়োজন।" spk.1096
4
+ ted_1096_2 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:41827555529:6208 19 (হাসি) spk.1096
5
+ ted_1096_3 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:46434264544:14848 46 আমি শপথ করছি। spk.1096
6
+ ted_1096_4 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:13281223497:447168 1397 তাই, আমি যা আশা করছিলাম ঠিক তা নয়, তবে আমি চলে গেলাম -- সিঁড়ি বেয়ে, হলের নিচে, 'আসল' দমকল কর্মীদের পেরিয়ে, যারা এই মুহুর্তে আগুন নেভানোর জন্য অনেকটাই সম্পন্ন করেছে, মাস্টার বেডরুমে এক জোড়া জুতো. spk.1096
7
+ ted_1096_5 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:35969158042:152768 477 এখন আমি জানি আপনি কি ভাবছেন, কিন্তু আমি কোন নায়ক নই। spk.1096
8
+ ted_1096_6 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:41927428403:194048 606 আমি আমার পেলোডটি নীচে নিয়ে গিয়েছিলাম যেখানে সামনের দরজায় আমার নেমেসিস এবং মূল্যবান কুকুরটির সাথে দেখা হয়েছিল। spk.1096
9
+ ted_1096_7 /home/deepakprasad/nlp_code/Bengali_MUSTC/en-bn/fbank80.zip:5964728808:236928 740 আমরা আমাদের ধন-সম্পদ বাইরে বাড়ির মালিকের কাছে নিয়ে গিয়েছিলাম, যেখানে আশ্চর্যজনকভাবে তিনি আমার চেয়ে অনেক বেশি মনোযোগ পেয়েছিলেন। spk.1096
app.py CHANGED
@@ -78,6 +78,11 @@ def run_my_code(input_text, language):
78
  data_root="./MUSTC_ROOT_german/en-de/"
79
  d_r="MUSTC_ROOT_german/"
80
  yam="./MUSTC_ROOT_german/en-de/data/tst-COMMON/txt/tst-COMMON.yaml"
 
 
 
 
 
81
 
82
 
83
 
@@ -135,7 +140,7 @@ output_textbox = gr.outputs.Textbox(label="The Translated Text is:")
135
  # Create a Gradio interface
136
  iface = gr.Interface(
137
  fn=run_my_code,
138
- inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American/British English Accent)..."), gr.inputs.Radio(["Hindi", "French", "German"], label="Language")],
139
  outputs=output_textbox,
140
  title="English Speech to Text Translator")
141
 
 
78
  data_root="./MUSTC_ROOT_german/en-de/"
79
  d_r="MUSTC_ROOT_german/"
80
  yam="./MUSTC_ROOT_german/en-de/data/tst-COMMON/txt/tst-COMMON.yaml"
81
+ if(language=="Bengali"):
82
+ model_checkpoint = "./models/bengali_model.pt"
83
+ data_root="./MUSTC_ROOT_bengali/en-bn/"
84
+ d_r="MUSTC_ROOT_bengali/"
85
+ yam="./MUSTC_ROOT_bengali/en-bn/data/tst-COMMON/txt/tst-COMMON.yaml"
86
 
87
 
88
 
 
140
  # Create a Gradio interface
141
  iface = gr.Interface(
142
  fn=run_my_code,
143
+ inputs=[gr.inputs.Audio(source="microphone", type="filepath", label="Record something (in American/British English Accent)..."), gr.inputs.Radio(["Hindi", "Bengali", "French", "German"], label="Language")],
144
  outputs=output_textbox,
145
  title="English Speech to Text Translator")
146