Macedonian-ASR
/

buki-whisper-2.0

Model card Files Files and versions Community

Porjaz commited on Jan 27

Commit

2a0a9d6

·

verified ·

1 Parent(s): 9ec17dd

Update custom_interface_app.py

Files changed (1) hide show

custom_interface_app.py +2 -1

custom_interface_app.py CHANGED Viewed

@@ -85,12 +85,13 @@ class ASR(Pretrained):
         # waveform, sr = librosa.load(file, sr=sr)
         waveform, file_sr = torchaudio.load(file)
         # resample if not 16kHz
         if file_sr != sr:
             waveform = torchaudio.transforms.Resample(file_sr, sr)(waveform)
         # limit to 1 min
-        waveform = waveform[:, :60*sr]
         waveform = waveform.squeeze()
         audio_length = len(waveform) / sr

         # waveform, sr = librosa.load(file, sr=sr)
         waveform, file_sr = torchaudio.load(file)
+        waveform = waveform.mean(dim=0, keepdim=True) # convert to mono
         # resample if not 16kHz
         if file_sr != sr:
             waveform = torchaudio.transforms.Resample(file_sr, sr)(waveform)
         # limit to 1 min
+        # waveform = waveform[:, :60*sr]
         waveform = waveform.squeeze()
         audio_length = len(waveform) / sr