Spaces:

SUHHHH
/

youtube_test

Sleeping

App Files Files Community

SUHHHH commited on Sep 17, 2024

Commit

b1aeb47

verified ·

1 Parent(s): 161ad03

Update app.py

Browse files

Files changed (1) hide show

app.py +60 -3

app.py CHANGED Viewed

@@ -1,9 +1,46 @@
-import os
 import openai
-# 환경 변수에서 OpenAI API 키를 가져오기
 def textToSummary(text):
-    openai.api_key = os.getenv("OPENAI_API_KEY")  # 환경 변수에서 가져오기
     response = openai.Completion.create(
         model="text-davinci-003",
         prompt="Summarize this in 200 words or less:\n\n" + text,
@@ -14,3 +51,23 @@ def textToSummary(text):
         presence_penalty=1
     )
     return response["choices"][0]["text"].replace("\n", " ").strip()

+# URL To YoutubeID
+from urllib.parse import urlparse
+from youtube_transcript_api import YouTubeTranscriptApi
+from youtube_transcript_api.formatters import TextFormatter
 import openai
+import os
+import gradio as gr
+# 유튜브 비디오 ID 추출 함수
+def get_yt_video_id(url):
+    from urllib.parse import urlparse, parse_qs
+    if url.startswith(('youtu', 'www')):
+        url = 'http://' + url
+    query = urlparse(url)
+    if 'youtube' in query.hostname:
+        if query.path == '/watch':
+            return parse_qs(query.query)['v'][0]
+        elif query.path.startswith(('/embed/', '/v/')):
+            return query.path.split('/')[2]
+    elif 'youtu.be' in query.hostname:
+        return query.path[1:]
+    else:
+        raise ValueError("유효한 유튜브 링크가 아닙니다.")
+# 유튜브 영상의 자막을 가져오는 함수
+def transcribe(youtubeId):
+    transcription = YouTubeTranscriptApi.get_transcript(youtubeId)
+    return transcription
+# 자막을 텍스트로 변환하는 함수
+formatter = TextFormatter()
+def transcriptToText(transcript):
+    text = formatter.format_transcript(transcript)
+    text = text.replace("\n", " ")
+    return text
+# 텍스트를 요약하는 함수 (OpenAI API 사용, 환경 변수로 키를 가져옴)
 def textToSummary(text):
+    openai.api_key = os.getenv("OPENAI_API_KEY")  # 환경 변수에서 OpenAI API 키 가져오기
     response = openai.Completion.create(
         model="text-davinci-003",
         prompt="Summarize this in 200 words or less:\n\n" + text,
         presence_penalty=1
     )
     return response["choices"][0]["text"].replace("\n", " ").strip()
+# 전체 요약 프로세스를 처리하는 함수
+def summarize(url):
+    try:
+        videoId = get_yt_video_id(url)
+        transcript = transcribe(videoId)
+        text = transcriptToText(transcript)
+        summary = textToSummary(text)
+        return summary
+    except Exception as e:
+        return f"요약에 실패했습니다: {str(e)}"
+# Gradio 인터페이스 설정
+description = "요약할 유튜브 동영상 링크를 입력하세요"
+gr.Interface(fn=summarize,
+             inputs="text",
+             outputs="textbox",
+             description=description
+            ).launch()