polodealvarado
/

xls-r-300m-es

Automatic Speech Recognition

common_voice_8_0

Generated from Trainer

hf-asr-leaderboard

mozilla-foundation/common_voice_8_0

robust-speech-event

Inference Endpoints

Model card Files Files and versions Community

polodealvarado commited on Feb 1, 2022

Commit

99abccf

•

1 Parent(s): 2485928

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -59,7 +59,7 @@ def remove_extra_chars(batch):
 # Preparing dataset
 def prepare_dataset(batch):
     audio = batch["audio"]
-    batch["input_values"] = processor(audio["array"], sampling_rate=audio["sampling_rate"]).input_values[0]
     with processor.as_target_processor():
         batch["labels"] = processor(batch["sentence"]).input_ids
     return batch
@@ -72,10 +72,10 @@ common_voice_test = common_voice_test.map(remove_extra_chars, remove_columns=dat
 common_voice_test = common_voice_test.map(prepare_dataset)
 # Testing first sample
-input = common_voice_test["input_values"]
 with torch.no_grad():
-    logits = model(**inputs).logits
 pred_ids = torch.argmax(logits, dim=-1)
 text = processor.batch_decode(logits.numpy()).text

 # Preparing dataset
 def prepare_dataset(batch):
     audio = batch["audio"]
+    batch["input_values"] = processor(audio["array"], sampling_rate=audio["sampling_rate"],return_tensors="pt",padding=True).input_values[0]
     with processor.as_target_processor():
         batch["labels"] = processor(batch["sentence"]).input_ids
     return batch
 common_voice_test = common_voice_test.map(prepare_dataset)
 # Testing first sample
+inputs = torch_tensor(common_voice_test[0]["input_values"])
 with torch.no_grad():
+    logits = model(inputs).logits
 pred_ids = torch.argmax(logits, dim=-1)
 text = processor.batch_decode(logits.numpy()).text