return recap_result
def return_prediction_w2v2(mic=None, file=None, device=device):
if mic is not None:
waveform, sr = librosa.load(mic, sr=16000)
waveform = waveform[:60*sr]
w2v2_result = w2v2_classifier.classify_file_w2v2(waveform, device)
elif file is not None:
waveform, sr = librosa.load(file, sr=16000)
waveform = waveform[:60*sr]
w2v2_result = w2v2_classifier.classify_file_w2v2(waveform, device)
return "You must either provide a mic recording or a file"
recap_result = recap_sentence(w2v2_result[0])
# If the letter after punct is small, recap it
for i, letter in enumerate(recap_result):
if i > 1 and recap_result[i-2] in [".", "!", "?"] and letter.islower():
recap_result = recap_result[:i] + letter.upper() + recap_result[i+1:]
return recap_result
def return_prediction_whisper_mic(mic=None, progress=gr.Progress(), device=device):
progress(0, desc="Транскриптот се генерира")
# waveform = waveform[:30*sr]
whisper_result = whisper_classifier.classify_file_whisper_mkd(waveform, device)
return "You must provide a mic recording"
recap_result = ""
prev_segment = ""
# waveform = waveform[:3600*sr]
whisper_result = whisper_classifier.classify_file_whisper_mkd(waveform, device)
return "You must provide a mic recording"
recap_result = ""
prev_segment = ""
with gr.Blocks() as mic_transcribe_whisper:
def clear_outputs():
with gr.Row():
audio_input = gr.Audio(sources="microphone", type="filepath", label="Record Audio")
4. **Никола Стиков**
Оваа колаборација е дел од активностите на **Центарот за напредни интердисциплинарни истражувања ([ЦеНИИс](https://ukim.edu.mk/en/centri/centar-za-napredni-interdisciplinarni-istrazhuvanja-ceniis))** при УКИМ.
## Во тренирањето на овој модел се употребени податоци од:
1. Дигитален архив за етнолошки и антрополошки ресурси ([ДАЕАР](https://iea.pmf.ukim.edu.mk/tabs/view/61f236ed7d95176b747c20566ddbda1a)) при Институтот за етнологија и антропологија, Природно-математички факултет при УКИМ.
2. Аудио верзија на меѓународното списание [„ЕтноАнтропоЗум“](https://etno.pmf.ukim.mk/index.php/eaz/issue/archive) на Институтот за етнологија и антропологија, Природно-математички факултет при УКИМ.
3. Аудио подкастот [„Обични луѓе“](https://obicniluge.mk/episodes/) на Илина Јакимовска
4. Научните видеа од серијалот [„Наука за деца“](http://naukazadeca.mk), фондација [КАНТАРОТ](https://qantarot.substack.com/)
5. Македонска верзија на [Mozilla Common Voice](https://commonvoice.mozilla.org/en/datasets) (верзија 18.0)
## Како да придонесете за подобрување на македонските модели за препознавање на говор?
На следниот [линк](https://drive.google.com/file/d/1YdZJz9o1X8AMc6J4MNPnVZjASyIXnvoZ/view?usp=sharing) ќе најдете инструкции за тоа како да донирате македонски говор преку платформата Mozilla Common Voice.
# Custom CSS
state = gr.State()
gr.Markdown(project_description, elem_classes="custom-markdown")
# [mic_transcribe_whisper, mic_transcribe_compare],
# ["Буки-Whisper транскрипција", "Споредба на модели"],
# )
[mic_transcribe_whisper, file_transcribe_whisper],
[" Буки-Whisper транскрипција од микрофон", "Буки-Whisper транскрипција од фајл"],
# transcriber_app.launch(debug=True, share=True, ssl_verify=False)
return recap_result
def return_prediction_whisper_mic(mic=None, progress=gr.Progress(), device=device):
progress(0, desc="Транскриптот се генерира")
# waveform = waveform[:30*sr]
whisper_result = whisper_classifier.classify_file_whisper_mkd(waveform, device)
return "You must provide a mic recording"
recap_result = ""
prev_segment = ""
# waveform = waveform[:3600*sr]
whisper_result = whisper_classifier.classify_file_whisper_mkd(waveform, device)
return "You must provide a mic recording"
recap_result = ""
prev_segment = ""
with gr.Blocks() as mic_transcribe_whisper:
def clear_outputs():
return None, "", None
with gr.Row():
audio_input = gr.Audio(sources="microphone", type="filepath", label="Record Audio")
4. **Никола Стиков**
Оваа колаборација е дел од активностите на **Центарот за напредни интердисциплинарни истражувања ([ЦеНИИс](https://ukim.edu.mk/en/centri/centar-za-napredni-interdisciplinarni-istrazhuvanja-ceniis))** при УКИМ.
# Custom CSS
state = gr.State()
gr.Markdown(project_description, elem_classes="custom-markdown")
[mic_transcribe_whisper, file_transcribe_whisper],
[" Буки-Whisper транскрипција од микрофон", "Буки-Whisper транскрипција од фајл"],
# transcriber_app.launch(debug=True, share=True, ssl_verify=False)