Spaces:

Mageia
/

GOT-OCR-Optimize

Running

Mageia commited on Oct 16, 2024

Commit

490e90d

unverified ·

1 Parent(s): a749292

fix: process pdf once

Files changed (1) hide show

app.py CHANGED Viewed

@@ -45,12 +45,10 @@ def ocr_process(file, got_mode, ocr_color="", ocr_box="", progress=gr.Progress()
         progress(0, desc="开始处理...")
         with tempfile.TemporaryDirectory() as temp_dir:
-            if file.name.lower().endswith(".pdf"):
-                pdf_path = os.path.join(temp_dir, "temp.pdf")
-                with open(pdf_path, "wb") as f:
-                    f.write(file.read())
-                images = pdf_to_images(pdf_path)
                 num_pages = len(images)
                 results = []
@@ -64,10 +62,7 @@ def ocr_process(file, got_mode, ocr_color="", ocr_box="", progress=gr.Progress()
                 final_result = "\n\n".join(results)
             else:
-                img_path = os.path.join(temp_dir, "temp_image.png")
-                with open(img_path, "wb") as f:
-                    f.write(file.read())
-                final_result = process_single_image(img_path, got_mode, ocr_color, ocr_box)
         progress(1, desc="处理完成")
         return final_result

         progress(0, desc="开始处理...")
         with tempfile.TemporaryDirectory() as temp_dir:
+            file_path = file.name  # 使用文件的原始路径
+            if file_path.lower().endswith(".pdf"):
+                images = pdf_to_images(file_path)
                 num_pages = len(images)
                 results = []
                 final_result = "\n\n".join(results)
             else:
+                final_result = process_single_image(file_path, got_mode, ocr_color, ocr_box)
         progress(1, desc="处理完成")
         return final_result