Spaces:

SUHHHH
/

youtube_test

Sleeping

App Files Files Community

SUHHHH commited on Sep 17, 2024

Commit

dce378c

•

1 Parent(s): b1aeb47

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -20

app.py CHANGED Viewed

@@ -1,7 +1,6 @@
-# URL To YoutubeID
-from urllib.parse import urlparse
-from youtube_transcript_api import YouTubeTranscriptApi
-from youtube_transcript_api.formatters import TextFormatter
 import openai
 import os
 import gradio as gr
@@ -25,20 +24,36 @@ def get_yt_video_id(url):
     else:
         raise ValueError("유효한 유튜브 링크가 아닙니다.")
-# 유튜브 영상의 자막을 가져오는 함수
-def transcribe(youtubeId):
-    transcription = YouTubeTranscriptApi.get_transcript(youtubeId)
-    return transcription
-# 자막을 텍스트로 변환하는 함수
-formatter = TextFormatter()
-def transcriptToText(transcript):
-    text = formatter.format_transcript(transcript)
-    text = text.replace("\n", " ")
-    return text
-# 텍스트를 요약하는 함수 (OpenAI API 사용, 환경 변수로 키를 가져옴)
 def textToSummary(text):
     openai.api_key = os.getenv("OPENAI_API_KEY")  # 환경 변수에서 OpenAI API 키 가져오기
     response = openai.Completion.create(
@@ -55,16 +70,18 @@ def textToSummary(text):
 # 전체 요약 프로세스를 처리하는 함수
 def summarize(url):
     try:
-        videoId = get_yt_video_id(url)
-        transcript = transcribe(videoId)
-        text = transcriptToText(transcript)
-        summary = textToSummary(text)
         return summary
     except Exception as e:
         return f"요약에 실패했습니다: {str(e)}"
 # Gradio 인터페이스 설정
-description = "요약할 유튜브 동영상 링크를 입력하세요"
 gr.Interface(fn=summarize,
              inputs="text",

+from pytube import YouTube
+from google.cloud import speech_v1p1beta1 as speech
+import io
 import openai
 import os
 import gradio as gr
     else:
         raise ValueError("유효한 유튜브 링크가 아닙니다.")
+# 오디오 추출 함수
+def download_audio(youtube_url):
+    yt = YouTube(youtube_url)
+    stream = yt.streams.filter(only_audio=True).first()
+    audio_path = stream.download(filename="audio.mp4")
+    return audio_path
+# Google Speech-to-Text API를 사용하여 오디오를 텍스트로 변환
+def speech_to_text(audio_path):
+    client = speech.SpeechClient()
+    with io.open(audio_path, "rb") as audio_file:
+        content = audio_file.read()
+    audio = speech.RecognitionAudio(content=content)
+    config = speech.RecognitionConfig(
+        encoding=speech.RecognitionConfig.AudioEncoding.ENCODING_UNSPECIFIED,
+        sample_rate_hertz=16000,
+        language_code="ko-KR"  # 한국어 인식
+    )
+    response = client.recognize(config=config, audio=audio)
+    transcript = ""
+    for result in response.results:
+        transcript += result.alternatives[0].transcript + " "
+    return transcript.strip()
+# 텍스트를 요약하는 함수 (OpenAI API 사용)
 def textToSummary(text):
     openai.api_key = os.getenv("OPENAI_API_KEY")  # 환경 변수에서 OpenAI API 키 가져오기
     response = openai.Completion.create(
 # 전체 요약 프로세스를 처리하는 함수
 def summarize(url):
     try:
+        # 유튜브 오디오 다운로드
+        audio_path = download_audio(url)
+        # 음성을 텍스트로 변환
+        transcript = speech_to_text(audio_path)
+        # 텍스트 요약
+        summary = textToSummary(transcript)
         return summary
     except Exception as e:
         return f"요약에 실패했습니다: {str(e)}"
 # Gradio 인터페이스 설정
+description = "유튜브 동영상의 자막이 없더라도 음성 인식 기능을 사용해 요약합니다."
 gr.Interface(fn=summarize,
              inputs="text",