try555

Sleeping

App Files Files Community

Rajagopal commited on Jun 16, 2023

Commit

7dda26f

0 Parent(s):

Duplicate from Rajagopal/try423

Browse files

Files changed (4) hide show

.gitattributes +34 -0
README.md +13 -0
app.py +88 -0
requirements.txt +7 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: csrd trying
+emoji: 🏆
+colorFrom: yellow
+colorTo: gray
+sdk: streamlit
+sdk_version: 1.21.0
+app_file: app.py
+pinned: false
+duplicated_from: Rajagopal/try423
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,88 @@

+import streamlit as st
+from langchain import OpenAI, PromptTemplate, LLMChain
+from langchain.text_splitter import CharacterTextSplitter
+from langchain.chains.mapreduce import MapReduceChain
+from langchain.prompts import PromptTemplate
+from langchain.chat_models import AzureChatOpenAI
+from langchain.chains.summarize import load_summarize_chain
+from langchain.chains import AnalyzeDocumentChain
+from PyPDF2 import PdfReader
+from langchain.document_loaders import TextLoader
+from langchain.indexes import VectorstoreIndexCreator
+from langchain.document_loaders import PyPDFLoader
+import os
+os.environ["OPENAI_API_TYPE"] = "azure"
+os.environ["OPENAI_API_VERSION"] = "2023-03-15-preview"
+llm = AzureChatOpenAI(
+    deployment_name="esujnand", model_name="gpt-35-turbo"
+)
+st.title("Wipro CSRD AI 1")
+# description text
+st.write("Step 1: Summary of your selected section of CSRD... Sections in this are enviormental  topic1, enviornamtal topic2 ")
+st.write("Step 2: Ask your specfici questions regarding a CSRD disclosure requirments")
+# pdf file upload
+pdf_file = st.file_uploader("Upload file", type=["pdf"])
+numberofpages = 100
+if st.button("How many pages? "):
+    reader = PdfReader(pdf_file)
+    numberofpages = len(reader.pages)
+    st.write("length is ", numberofpages)
+if st.button("table of contents? "):
+  reader = PdfReader(pdf_file)
+  page = reader.pages[2].extract_text()
+  st.write(page)
+startpage = st.slider('Which section to look at', 0, numberofpages, 1)
+st.write("starting section page", startpage)
+pagecount = st.slider('How many pages', 1, 5, 1)
+st.write("pages to read", pagecount)
+def extract_text_from_pdf():
+    reader = PdfReader(pdf_file)
+    # get all pages text
+    text = [reader.pages[i].extract_text() for i in range(startpage, startpage + pagecount )]
+    # join all pages text
+    text = " ".join(text)
+    return text
+def extract_text_from_pdf2():
+    reader = PdfReader(pdf_file)
+    # get all pages text
+    text = [reader.pages[i].extract_text() for i in range(len(reader.pages))]
+    # join all pages text
+    text = " ".join(text)
+    return text
+if st.button("Summerize "):
+    with st.spinner("Extracting Text..."):
+        summary_chain = load_summarize_chain(llm, chain_type="map_reduce")
+        summarize_document_chain = AnalyzeDocumentChain(combine_docs_chain=summary_chain, verbose=True)
+        text = extract_text_from_pdf()
+    with st.spinner("Summarizing..."):
+        result = summarize_document_chain.run(text)
+    st.write(result)

requirements.txt ADDED Viewed

	@@ -0,0 +1,7 @@

+openai
+langchain
+streamlit
+PyPDF2
+tiktoken
+pypdf
+chromadb