Spaces:

SCBconsulting
/

synclm-demo

Running

SCBconsulting commited on 17 days ago

Commit

cb4344f

verified ·

1 Parent(s): a3b248d

Update utils/summarizer.py

Files changed (1) hide show

utils/summarizer.py CHANGED Viewed

@@ -1,11 +1,42 @@
 from transformers import pipeline
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
 def summarize_text(text):
     if not text.strip():
         return "No input provided."
-    text = text.replace("\n", " ").strip()[:1024]
-    summary = summarizer(text, max_length=130, min_length=30, do_sample=False)
-    return summary[0]["summary_text"]

+# utils/summarizer.py
 from transformers import pipeline
+# Load summarization pipeline
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
+def split_text(text, max_chunk_len=800):
+    """
+    Breaks long documents into smaller chunks for summarization.
+    """
+    sentences = text.split('. ')
+    chunks = []
+    current_chunk = ""
+    for sentence in sentences:
+        if len(current_chunk) + len(sentence) < max_chunk_len:
+            current_chunk += sentence + ". "
+        else:
+            chunks.append(current_chunk.strip())
+            current_chunk = sentence + ". "
+    if current_chunk:
+        chunks.append(current_chunk.strip())
+    return chunks
 def summarize_text(text):
+    """
+    Generate summary by chunking and combining.
+    """
     if not text.strip():
         return "No input provided."
+    chunks = split_text(text)
+    summaries = []
+    for chunk in chunks:
+        result = summarizer(chunk, max_length=130, min_length=30, do_sample=False)
+        summaries.append(result[0]["summary_text"])
+    return " ".join(summaries)