Spaces:

Pranav0111
/

youtube-summarizer

Sleeping

Pranav0111 commited on May 27

Commit

b4afcc8

verified ·

1 Parent(s): 5b7b66e

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -1,16 +1,34 @@
-from pytube import YouTube
-import whisper
 import tempfile
 from transformers import pipeline
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
 whisper_model = whisper.load_model("base")
 def download_audio(youtube_url):
-    yt = YouTube(youtube_url)
-    stream = yt.streams.filter(only_audio=True).first()
-    temp_dir = tempfile.mkdtemp()
-    return stream.download(output_path=temp_dir, filename="audio.mp4")
 def transcribe_audio(audio_path):
     result = whisper_model.transcribe(audio_path)

+import os
 import tempfile
+import whisper
+import subprocess
 from transformers import pipeline
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
 whisper_model = whisper.load_model("base")
 def download_audio(youtube_url):
+    try:
+        temp_dir = tempfile.mkdtemp()
+        audio_path = os.path.join(temp_dir, "audio.mp3")
+        command = [
+            "yt-dlp",
+            "-x", "--audio-format", "mp3",
+            "-o", audio_path,
+            youtube_url
+        ]
+        subprocess.run(command, check=True)
+        # yt-dlp renames with extensions, so fix actual filename
+        files = os.listdir(temp_dir)
+        if files:
+            return os.path.join(temp_dir, files[0])
+        else:
+            raise Exception("No audio file downloaded.")
+    except Exception as e:
+        print("Error downloading audio:", str(e))
+        raise e
 def transcribe_audio(audio_path):
     result = whisper_model.transcribe(audio_path)