anyantudre commited on
Commit
f1e09ef
·
verified ·
1 Parent(s): c672237

Update goai_stt.py

Browse files
Files changed (1) hide show
  1. goai_stt.py +13 -4
goai_stt.py CHANGED
@@ -1,4 +1,5 @@
1
  import torch
 
2
  import librosa
3
  import time
4
  from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
@@ -37,11 +38,19 @@ def goai_stt(fichier):
37
  if isinstance(fichier, str):
38
  ### preprocessing de l'audio à partir d'un fichier
39
  signal, sampling_rate = librosa.load(fichier, sr=16000)
40
- else:
 
41
  ### preprocessing de l'audio à partir d'un tableau numpy
42
- signal, sampling_rate = fichier
 
 
 
43
 
44
- inputs = processor(signal, sampling_rate=16_000, return_tensors="pt", padding=True).to(device)
 
 
 
 
45
 
46
  ### faire l'inference
47
  with torch.no_grad():
@@ -51,4 +60,4 @@ def goai_stt(fichier):
51
  transcription = processor.decode(pred_ids)
52
 
53
  print("Temps écoulé: ", int(time.time() - start_time), " secondes")
54
- return transcription
 
1
  import torch
2
+ import numpy as np
3
  import librosa
4
  import time
5
  from transformers import set_seed, Wav2Vec2ForCTC, AutoProcessor
 
38
  if isinstance(fichier, str):
39
  ### preprocessing de l'audio à partir d'un fichier
40
  signal, sampling_rate = librosa.load(fichier, sr=16000)
41
+
42
+ elif isinstance(fichier, np.ndarray):
43
  ### preprocessing de l'audio à partir d'un tableau numpy
44
+ signal = fichier
45
+ sampling_rate = 16000
46
+ else:
47
+ raise ValueError("Le type de fichier audio est invalide.")
48
 
49
+ # Ensure the signal is a numpy array and has correct dimensions
50
+ if not isinstance(signal, np.ndarray):
51
+ raise TypeError("Le signal audio doit être un tableau numpy.")
52
+
53
+ inputs = processor(signal, sampling_rate=sampling_rate, return_tensors="pt", padding=True).to(device)
54
 
55
  ### faire l'inference
56
  with torch.no_grad():
 
60
  transcription = processor.decode(pred_ids)
61
 
62
  print("Temps écoulé: ", int(time.time() - start_time), " secondes")
63
+ return transcription