Spaces:

ahalamora
/

QISU

Sleeping

App Files Files Community

ahalamora commited on Sep 7, 2023

Commit

5b2093c

1 Parent(s): 5163f47

Upload 3 files

Browse files

Files changed (3) hide show

app.py +93 -0
doc_process.py +180 -0
requirements.txt +4 -0

app.py ADDED Viewed

	@@ -0,0 +1,93 @@

+import streamlit as st
+import os
+import shutil
+import zipfile
+from zipfile import ZipFile
+from doc_process import doc_process
+extract_folder = 'documents'
+def recode(raw: str) -> str:
+    '''
+    编码修正
+    '''
+    try:
+        return raw.encode('cp437').decode('utf-8')
+    except:
+        return raw.encode('utf-8').decode('utf-8')
+def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None:
+    # 遍历压缩包内所有内容，创建所有目录
+    for file_or_path in file.namelist():
+        print(file_or_path)
+        # 若当前节点是文件夹
+        if file_or_path.endswith('/'):
+            try:
+                # 基于当前文件夹节点创建多层文件夹
+                os.makedirs(os.path.join(target_path, recode(file_or_path)))
+            except FileExistsError:
+                # 若已存在则跳过创建过程
+                pass
+        # 否则视作文件进行写出
+        else:
+            pass
+    # 遍历压缩包内所有内容，解压文件
+    for file_or_path in file.namelist():
+        print(file_or_path)
+        # 若当前节点是文件夹
+        if file_or_path.endswith('/'):
+            pass
+        # 否则视作文件进行写出
+        else:
+            # 利用shutil.copyfileobj，从压缩包io流中提取目标文件内容写出到目标路径
+            with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z:
+                # 这里基于Zipfile.open()提取文件内容时需要使用原始的乱码文件名
+                shutil.copyfileobj(src_zip_file.open(file_or_path), z)
+st.title('起诉书 & 委托书 - 自动处理程序')
+st.markdown('#### 请上传ZIP压缩文件：')
+# 添加一个文件上传组件
+uploaded_file = st.file_uploader("选择要上传的文件", type=["zip"])
+# 如果有文件上传
+if uploaded_file:
+    # 保存上传的ZIP文件到本地临时目录
+    with open("temp.zip", "wb") as f:
+        f.write(uploaded_file.read())
+    # 创建文档目录
+    os.makedirs(extract_folder, exist_ok=True)
+    # 解压ZIP文件中的文件并处理文件名和内容
+    with zipfile.ZipFile("temp.zip", "r") as file:
+        # for file_or_path in file.namelist():
+        #     print(file_or_path, ' -------> ' , recode(file_or_path))
+        zip_extract_all(file, extract_folder)
+    # 显示解压缩完成的消息
+    st.success(f"ZIP文件已成功解压缩到目录 {extract_folder}")
+    input_folder = os.listdir(extract_folder)[0] if os.listdir(extract_folder)[0] != 'output' else os.listdir(extract_folder)[1]
+    print(input_folder)
+    # 删除临时文件
+    os.remove("temp.zip")
+if st.button('自动处理并压缩成文件'):
+    input_path = os.path.join(extract_folder, input_folder)
+    output_path = os.path.join(extract_folder, 'output')
+    result = doc_process(input_path=input_path, output_path=output_path)
+    st.markdown(result)

doc_process.py ADDED Viewed

	@@ -0,0 +1,180 @@

+import os
+import pandas as pd
+from docx import Document
+from docx.shared import Pt
+from docx.oxml.ns import qn
+def doc_process(input_path, output_path):
+    qsz_folder = os.path.join(input_path, '起诉状')
+    wts_folder = os.path.join(input_path, '委托书')
+    info_path = os.path.join(input_path, 'info.xlsx')
+    qsz_output_shex = os.path.join(output_path, '起诉状_上海耳序')
+    qsz_output_fjzy = os.path.join(output_path, '起诉状_福建智云')
+    qsz_output_hnsx = os.path.join(output_path, '起诉状_海南申信')
+    wts_output_shex = os.path.join(output_path, '委托书_上海耳序')
+    wts_output_fjzy = os.path.join(output_path, '委托书_福建智云')
+    wts_output_hnsx = os.path.join(output_path, '委托书_海南申信')
+    phone_wanglei = '18916935832'
+    phone_zhangliren = '13817213203'
+    qsz_file_list = os.listdir(qsz_folder)
+    wts_file_list = os.listdir(wts_folder)
+    if not os.path.exists(os.path.join(output_path)):
+        os.mkdir(os.path.join(output_path))
+    if not os.path.exists(qsz_output_shex):
+        os.mkdir(qsz_output_shex)
+    if not os.path.exists(qsz_output_fjzy):
+        os.mkdir(qsz_output_fjzy)
+    if not os.path.exists(qsz_output_hnsx):
+        os.mkdir(qsz_output_hnsx)
+    if not os.path.exists(wts_output_shex):
+        os.mkdir(wts_output_shex)
+    if not os.path.exists(wts_output_fjzy):
+        os.mkdir(wts_output_fjzy)
+    if not os.path.exists(wts_output_hnsx):
+        os.mkdir(wts_output_hnsx)
+    df = pd.read_excel(info_path)
+    num_shex = 0
+    num_fjzy = 0
+    num_hnsx = 0
+    # 改管辖法院，并存到对应融担公司的目录中
+    for qsz_file in qsz_file_list:
+        # 读取起诉状文件
+        qsz_path = os.path.join(qsz_folder, qsz_file)
+        # 加载Docx文件
+        doc = Document(qsz_path)
+        # 从文件名获取合同号
+        contract_id = qsz_file.split('_')[1]
+        # 从表格中找到对应合同号的管辖法院
+        court = df[df['合同号']==contract_id]['管辖法院'].tolist()[0]
+        # 将正确的管辖法院更新到Docx中（加run设置字体）
+        doc.paragraphs[-6].text = ''
+        run = doc.paragraphs[-6].add_run(court)
+        run.font.name = "Arial"
+        run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+        # 调整字体大小
+        font = doc.paragraphs[-6].style.font
+        font.size = Pt(14)
+        # 判断担保公司
+        if '福建智云' in df[df['合同号']==contract_id]['融担公司'].tolist()[0]:
+            output_folder = qsz_output_fjzy
+            num_fjzy += 1
+        elif '海南申信' in df[df['合同号']==contract_id]['融担公司'].tolist()[0]:
+            output_folder = qsz_output_hnsx
+            num_hnsx += 1
+        else:
+            output_folder = qsz_output_shex
+            num_shex += 1
+        # 保存文件到对应目录
+        output_path = os.path.join(output_folder, qsz_file)
+        doc.save(output_path)
+    # 改律师名字和电话，并存到对应融担公司的目录中
+    for wts_file in wts_file_list:
+        # 读取委托书文件
+        wts_path = os.path.join(wts_folder, wts_file)
+        # 加载Docx文件
+        doc = Document(wts_path)
+        # 从文件名获取合同号
+        contract_id = wts_file.split('_')[1]
+        # 从表格中找到对应合同号的管辖法院
+        lawyer = df[df['合同号']==contract_id]['承办律师'].tolist()[0]
+        user = df[df['合同号']==contract_id]['用户姓名'].tolist()[0]
+        # 替换律师和电话
+        if lawyer != '王磊':
+            for p in doc.paragraphs:
+                if '王磊' in p.text and user not in p.text:
+                    text_new_name = p.text.replace('王磊', '张立人')
+                    p.text = ''
+                    # 加run用于修改字体
+                    run = p.add_run(text_new_name)
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    # 调整字体
+                    font = p.style.font
+                    font.size = Pt(14)
+                if phone_wanglei in p.text:
+                    text_new_phone = p.text.replace(phone_wanglei, phone_zhangliren)
+                    p.text = ''
+                    # 加run用于修改字体
+                    run = p.add_run(text_new_phone)
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    # 调整字体
+                    font = p.style.font
+                    font.size = Pt(14)
+                if '王磊' in p.text and user in p.text:
+                    # 现委托 王磊 在我单位与 沈黎宾 追偿权纠纷案件中，作为我单位的委托代理人，代理权限如下：
+                    p.text = ''
+                    run = p.add_run('现委托')
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    run = p.add_run(' 张立人 ')
+                    run.font.underline = True
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    run = p.add_run('在我单位与')
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    run = p.add_run(f' {user} ')
+                    run.font.underline = True
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+                    run = p.add_run('追偿权纠纷案件中，作为我单位的委托代理人，代理权限如下：')
+                    run.font.name = "Arial"
+                    run._element.rPr.rFonts.set(qn('w:eastAsia'),'宋体')
+        # 判断担保公司
+        if '福建智云' in df[df['合同号']==contract_id]['融担公司'].tolist()[0]:
+            output_folder = wts_output_fjzy
+        elif '海南申信' in df[df['合同号']==contract_id]['融担公司'].tolist()[0]:
+            output_folder = wts_output_hnsx
+        else:
+            output_folder = wts_output_shex
+        # 保存文件到对应目录
+        output_path = os.path.join(output_folder, wts_file)
+        doc.save(output_path)
+    total_have = len(qsz_file_list)
+    total_done = num_shex+num_fjzy+num_hnsx
+    result = f'共 {total_have} 条\n完成 {total_done} 条\n\n上海耳序：共 {num_shex} 条\n\n福建智云：共 {num_fjzy} 条\n\n海南申信：共 {num_hnsx} 条\n\n所有文档已完成自动编辑！'
+    return result
+if __name__ == '__main__':
+    doc_process()

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+pandas==2.1.0
+python-docx==0.8.11
+openpyxl==3.1.2
+pyinstaller==5.13.2