Spaces:
Runtime error
Runtime error
Update goai_stt.py
Browse files- goai_stt.py +13 -4
goai_stt.py
CHANGED
@@ -1,4 +1,5 @@
|
|
1 |
import torch
|
|
|
2 |
import librosa
|
3 |
import time
|
4 |
from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
|
@@ -37,11 +38,19 @@ def goai_stt(fichier):
|
|
37 |
if isinstance(fichier, str):
|
38 |
### preprocessing de l'audio à partir d'un fichier
|
39 |
signal, sampling_rate = librosa.load(fichier, sr=16000)
|
40 |
-
|
|
|
41 |
### preprocessing de l'audio à partir d'un tableau numpy
|
42 |
-
signal
|
|
|
|
|
|
|
43 |
|
44 |
-
|
|
|
|
|
|
|
|
|
45 |
|
46 |
### faire l'inference
|
47 |
with torch.no_grad():
|
@@ -51,4 +60,4 @@ def goai_stt(fichier):
|
|
51 |
transcription = processor.decode(pred_ids)
|
52 |
|
53 |
print("Temps écoulé: ", int(time.time() - start_time), " secondes")
|
54 |
-
return transcription
|
|
|
1 |
import torch
|
2 |
+
import numpy as np
|
3 |
import librosa
|
4 |
import time
|
5 |
from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
|
|
|
38 |
if isinstance(fichier, str):
|
39 |
### preprocessing de l'audio à partir d'un fichier
|
40 |
signal, sampling_rate = librosa.load(fichier, sr=16000)
|
41 |
+
|
42 |
+
elif isinstance(fichier, np.ndarray):
|
43 |
### preprocessing de l'audio à partir d'un tableau numpy
|
44 |
+
signal = fichier
|
45 |
+
sampling_rate = 16000
|
46 |
+
else:
|
47 |
+
raise ValueError("Le type de fichier audio est invalide.")
|
48 |
|
49 |
+
# Ensure the signal is a numpy array and has correct dimensions
|
50 |
+
if not isinstance(signal, np.ndarray):
|
51 |
+
raise TypeError("Le signal audio doit être un tableau numpy.")
|
52 |
+
|
53 |
+
inputs = processor(signal, sampling_rate=sampling_rate, return_tensors="pt", padding=True).to(device)
|
54 |
|
55 |
### faire l'inference
|
56 |
with torch.no_grad():
|
|
|
60 |
transcription = processor.decode(pred_ids)
|
61 |
|
62 |
print("Temps écoulé: ", int(time.time() - start_time), " secondes")
|
63 |
+
return transcription
|