vmasmitja
commited on
Commit
路
ab01055
1
Parent(s):
ececff5
Fix app initialization issue
Browse files- app.py +11 -4
- requirements.txt +2 -1
app.py
CHANGED
@@ -1,18 +1,25 @@
|
|
1 |
import gradio as gr
|
|
|
|
|
2 |
from transformers import pipeline
|
3 |
|
4 |
# Cargar el modelo de transcripci贸n Whisper
|
5 |
transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-small")
|
6 |
|
7 |
-
# Funci贸n para transcribir audio
|
8 |
def transcribe(audio):
|
9 |
-
|
|
|
|
|
|
|
|
|
|
|
10 |
return result["text"]
|
11 |
|
12 |
-
# Crear interfaz Gradio
|
13 |
demo = gr.Interface(
|
14 |
fn=transcribe,
|
15 |
-
inputs=gr.Audio(type="filepath"), #
|
16 |
outputs="text",
|
17 |
title="Transcripci贸n de Audio en Vivo",
|
18 |
description="Sube un archivo de audio para transcribir su contenido autom谩ticamente."
|
|
|
1 |
import gradio as gr
|
2 |
+
import numpy as np
|
3 |
+
import librosa
|
4 |
from transformers import pipeline
|
5 |
|
6 |
# Cargar el modelo de transcripci贸n Whisper
|
7 |
transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-small")
|
8 |
|
9 |
+
# Funci贸n para procesar y transcribir el audio
|
10 |
def transcribe(audio):
|
11 |
+
if audio is None:
|
12 |
+
raise ValueError("No se ha proporcionado un archivo de audio.")
|
13 |
+
|
14 |
+
# Cargar el archivo de audio como un array NumPy
|
15 |
+
audio_data, _ = librosa.load(audio, sr=16000) # Resample a 16 kHz
|
16 |
+
result = transcriber(np.array(audio_data))
|
17 |
return result["text"]
|
18 |
|
19 |
+
# Crear la interfaz Gradio
|
20 |
demo = gr.Interface(
|
21 |
fn=transcribe,
|
22 |
+
inputs=gr.Audio(type="filepath"), # Subida de archivos de audio
|
23 |
outputs="text",
|
24 |
title="Transcripci贸n de Audio en Vivo",
|
25 |
description="Sube un archivo de audio para transcribir su contenido autom谩ticamente."
|
requirements.txt
CHANGED
@@ -1,3 +1,4 @@
|
|
1 |
transformers
|
2 |
gradio
|
3 |
-
torch
|
|
|
|
1 |
transformers
|
2 |
gradio
|
3 |
+
torch
|
4 |
+
librosa
|