Spaces:

ikraamkb
/

Summarization

Running

App Files Files Community

ikraamkb commited on 12 days ago

Commit

0d83986

verified ·

1 Parent(s): c70bca3

link to frontend

Browse files

Files changed (1) hide show

app.py +25 -59

app.py CHANGED Viewed

@@ -8,11 +8,13 @@ import re
 import nltk
 from nltk.tokenize import sent_tokenize
 import torch
-from fastapi import FastAPI
 from fastapi.responses import RedirectResponse, FileResponse, JSONResponse
 from gtts import gTTS
 import tempfile
 import os
 import easyocr
 from fpdf import FPDF
 import datetime
@@ -23,6 +25,14 @@ nltk.download('punkt', quiet=True)
 app = FastAPI()
 MODEL_NAME = "facebook/bart-large-cnn"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME)
@@ -161,61 +171,19 @@ def create_pdf(summary: str, original_filename: str):
         print(f"Error creating PDF: {e}")
         return ""
-def summarize_document(file, summary_length: str, enable_tts: bool = True):
-    if file is None:
-        return "Please upload a document first", "", None, None
-    file_path = file.name
-    file_extension = file_path.split(".")[-1].lower()
-    original_filename = os.path.basename(file_path)
-    text, error = extract_text(file_path, file_extension)
-    if error:
-        return error, "", None, None
-    if not text or len(text.split()) < 30:
-        return "Document is too short or contains too little text to summarize", "", None, None
-    try:
-        summary = generate_summary(text, summary_length)
-        audio_path = text_to_speech(summary) if enable_tts else None
-        pdf_path = create_pdf(summary, original_filename) if summary else None
-        return summary, "", audio_path, pdf_path
-    except Exception as e:
-        return f"Summarization error: {str(e)}", "", None, None
-with gr.Blocks(title="Document Summarizer", theme=gr.themes.Soft()) as demo:
-    gr.Markdown("# 📄 Advanced Document Summarizer")
-    gr.Markdown("Upload a document to generate a summary with audio and optional PDF download")
-    with gr.Row():
-        with gr.Column():
-            file_input = gr.File(
-                label="Upload Document",
-                file_types=[".pdf", ".docx", ".pptx", ".xlsx", ".jpg", ".jpeg", ".png"],
-                type="filepath"
-            )
-            length_radio = gr.Radio(
-                ["short", "medium", "long"],
-                value="medium",
-                label="Summary Length"
-            )
-            submit_btn = gr.Button("Generate Summary", variant="primary")
-        with gr.Column():
-            output = gr.Textbox(label="Summary", lines=10)
-            audio_output = gr.Audio(label="Audio Summary")
-            pdf_download = gr.File(label="Download Summary as PDF", visible=False)
-    def summarize_and_return_ui(file, summary_length):
-        summary, _, audio_path, pdf_path = summarize_document(file, summary_length)
-        return (
-            summary,
-            audio_path,
-            gr.File(visible=pdf_path is not None, value=pdf_path)
-        )
-    submit_btn.click(
-        fn=summarize_and_return_ui,
-        inputs=[file_input, length_radio],
-        outputs=[output, audio_output, pdf_download]
-    )
 @app.get("/files/{file_name}")
 async def get_file(file_name: str):
@@ -224,8 +192,6 @@ async def get_file(file_name: str):
         return FileResponse(file_path)
     return JSONResponse({"error": "File not found"}, status_code=404)
-app = gr.mount_gradio_app(app, demo, path="/")
 @app.get("/")
 def redirect_to_interface():
-    return RedirectResponse(url="/")

 import nltk
 from nltk.tokenize import sent_tokenize
 import torch
+from fastapi import FastAPI, UploadFile, Form, File
 from fastapi.responses import RedirectResponse, FileResponse, JSONResponse
+from fastapi.middleware.cors import CORSMiddleware
 from gtts import gTTS
 import tempfile
 import os
+import shutil
 import easyocr
 from fpdf import FPDF
 import datetime
 app = FastAPI()
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=["*"],
+    allow_credentials=True,
+    allow_methods=["*"],
+    allow_headers=["*"],
+)
 MODEL_NAME = "facebook/bart-large-cnn"
 tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME)
         print(f"Error creating PDF: {e}")
         return ""
+@app.post("/summarize/")
+async def summarize_api(file: UploadFile = File(...), length: str = Form("medium")):
+    with tempfile.NamedTemporaryFile(delete=False, suffix=os.path.splitext(file.filename)[1]) as temp:
+        shutil.copyfileobj(file.file, temp)
+        temp.flush()
+        class FileObj: name = temp.name
+        summary, _, audio_path, pdf_path = summarize_document(FileObj, length)
+    return {
+        "summary": summary,
+        "audio_url": f"/files/{os.path.basename(audio_path)}" if audio_path else None,
+        "pdf_url": f"/files/{os.path.basename(pdf_path)}" if pdf_path else None
+    }
 @app.get("/files/{file_name}")
 async def get_file(file_name: str):
         return FileResponse(file_path)
     return JSONResponse({"error": "File not found"}, status_code=404)
 @app.get("/")
 def redirect_to_interface():
+    return RedirectResponse(url="/")