IdoMachlev
/

ido-whisper-turbo

IdoMachlev commited on Dec 25, 2024

Commit

a49a698

1 Parent(s): d62e007

changed attention implementation to "sdpa" from default "eager"

Files changed (1) hide show

handler.py CHANGED Viewed

@@ -13,7 +13,9 @@ class EndpointHandler():
         model_id = "openai/whisper-large-v3-turbo"
         model = AutoModelForSpeechSeq2Seq.from_pretrained(
-            model_id, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True
         )
         model.to(device)

         model_id = "openai/whisper-large-v3-turbo"
         model = AutoModelForSpeechSeq2Seq.from_pretrained(
+            model_id, torch_dtype=torch_dtype,
+            low_cpu_mem_usage=True, use_safetensors=True,
+            attn_implementation="sdpa"
         )
         model.to(device)