Spaces:

Ak28Akhil
/

TextSummarization

Sleeping

Akhil Koduri commited on Jun 20, 2024

Commit

44ef797

verified ·

1 Parent(s): 30b5eb3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,12 +3,13 @@ from transformers import pipeline
 import fitz  # PyMuPDF for handling PDFs
 from docx import Document
 import pypandoc
 # Initialize the summarization pipeline
 pipe = pipeline("summarization", model="facebook/bart-large-cnn")
 # Title of the app
-st.title("Text Summarization App")
 # Input text box
 input_text = st.text_area("Enter the text you want to summarize", height=200)
@@ -54,11 +55,15 @@ def chunk_text(text, max_len=1024):
     return chunks
 # Summarize button
 if st.button("Summarize"):
     if input_text:
         chunks = chunk_text(input_text)
-        summaries = [pipe(chunk)[0]['summary_text'] for chunk in chunks]
         st.subheader("Summary")
         st.write(' '.join(summaries))
     elif uploaded_file is not None:
@@ -72,7 +77,8 @@ if st.button("Summarize"):
             file_text = extract_text_from_docx(uploaded_file)
         chunks = chunk_text(file_text)
-        summaries = [pipe(chunk)[0]['summary_text'] for chunk in chunks]
         st.subheader("Summary")
         st.write(' '.join(summaries))
     else:

 import fitz  # PyMuPDF for handling PDFs
 from docx import Document
 import pypandoc
+from concurrent.futures import ThreadPoolExecutor
 # Initialize the summarization pipeline
 pipe = pipeline("summarization", model="facebook/bart-large-cnn")
 # Title of the app
+st.title("Text Summarizer")
 # Input text box
 input_text = st.text_area("Enter the text you want to summarize", height=200)
     return chunks
+def summarize_chunk(chunk):
+    return pipe(chunk)[0]['summary_text']
 # Summarize button
 if st.button("Summarize"):
     if input_text:
         chunks = chunk_text(input_text)
+        with ThreadPoolExecutor() as executor:
+            summaries = list(executor.map(summarize_chunk, chunks))
         st.subheader("Summary")
         st.write(' '.join(summaries))
     elif uploaded_file is not None:
             file_text = extract_text_from_docx(uploaded_file)
         chunks = chunk_text(file_text)
+        with ThreadPoolExecutor() as executor:
+            summaries = list(executor.map(summarize_chunk, chunks))
         st.subheader("Summary")
         st.write(' '.join(summaries))
     else: