Spaces:

joshuasundance
/

langchain-streamlit-demo

Running

App Files Files Community

Joshua Sundance Bailey commited on Dec 13, 2023

Commit

679726e

•

1 Parent(s): 64e3f44

parameterize research assistant llms

Browse files

Files changed (5) hide show

langchain-streamlit-demo/app.py +10 -4
langchain-streamlit-demo/research_assistant/__init__.py +2 -2
langchain-streamlit-demo/research_assistant/chain.py +11 -9
langchain-streamlit-demo/research_assistant/search/web.py +36 -38
langchain-streamlit-demo/research_assistant/writer.py +6 -3

langchain-streamlit-demo/app.py CHANGED Viewed

@@ -26,7 +26,7 @@ from llm_resources import (
  get_runnable,
  get_texts_and_multiretriever,
 )
-from research_assistant.chain import chain as research_assistant_chain
 __version__ = "2.0.1"
@@ -367,7 +367,7 @@ with sidebar:
 # --- LLM Instantiation ---
-st.session_state.llm = get_llm(
  provider=st.session_state.provider,
  model=model,
  provider_api_key=provider_api_key,
@@ -382,6 +382,8 @@ st.session_state.llm = get_llm(
  "AZURE_OPENAI_MODEL_VERSION": st.session_state.AZURE_OPENAI_MODEL_VERSION,
  },
 )
 # --- Chat History ---
 for msg in STMEMORY.messages:
@@ -448,12 +450,16 @@ if st.session_state.llm:
  WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper()),
  ]
  if st.session_state.provider in ("Azure OpenAI", "OpenAI"):
  st_callback = StreamlitCallbackHandler(st.container())
  callbacks.append(st_callback)
  research_assistant_tool = Tool.from_function(
  func=lambda s: research_assistant_chain.invoke(
  {"question": s},
- config=get_config(callbacks),
  ),
  name="web-research-assistant",
  description="this assistant returns a comprehensive report based on web research. for quick facts, use duckduckgo instead.",
@@ -473,7 +479,7 @@ if st.session_state.llm:
  doc_chain_tool = Tool.from_function(
  func=lambda s: st.session_state.doc_chain.invoke(
  s,
- config=get_config(callbacks),
  ),
  name="user-document-chat",
  description="this assistant returns a response based on the user's custom context. if the user's meaning is unclear, perhaps the answer is here. generally speaking, try this tool before conducting web research.",

  get_runnable,
  get_texts_and_multiretriever,
 )
+from research_assistant.chain import get_chain as get_research_assistant_chain
 __version__ = "2.0.1"
 # --- LLM Instantiation ---
+get_llm_args = dict(
  provider=st.session_state.provider,
  model=model,
  provider_api_key=provider_api_key,
  "AZURE_OPENAI_MODEL_VERSION": st.session_state.AZURE_OPENAI_MODEL_VERSION,
  },
 )
+get_llm_args_temp_zero = get_llm_args | {"temperature": 0.0}
+st.session_state.llm = get_llm(**get_llm_args)
 # --- Chat History ---
 for msg in STMEMORY.messages:
  WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper()),
  ]
  if st.session_state.provider in ("Azure OpenAI", "OpenAI"):
+ research_assistant_chain = get_research_assistant_chain(
+ search_llm=get_llm(**get_llm_args_temp_zero), # type: ignore
+ writer_llm=get_llm(**get_llm_args_temp_zero), # type: ignore
+ )
  st_callback = StreamlitCallbackHandler(st.container())
  callbacks.append(st_callback)
  research_assistant_tool = Tool.from_function(
  func=lambda s: research_assistant_chain.invoke(
  {"question": s},
+ # config=get_config(callbacks),
  ),
  name="web-research-assistant",
  description="this assistant returns a comprehensive report based on web research. for quick facts, use duckduckgo instead.",
  doc_chain_tool = Tool.from_function(
  func=lambda s: st.session_state.doc_chain.invoke(
  s,
+ # config=get_config(callbacks),
  ),
  name="user-document-chat",
  description="this assistant returns a response based on the user's custom context. if the user's meaning is unclear, perhaps the answer is here. generally speaking, try this tool before conducting web research.",

langchain-streamlit-demo/research_assistant/__init__.py CHANGED Viewed

@@ -1,3 +1,3 @@
-from research_assistant.chain import chain
-__all__ = ["chain"]


1	+ from research_assistant.chain import get_chain
2
3	+ __all__ = ["get_chain"]

langchain-streamlit-demo/research_assistant/chain.py CHANGED Viewed

@@ -1,16 +1,18 @@
 from langchain_core.pydantic_v1 import BaseModel
 from langchain_core.runnables import RunnablePassthrough
-from research_assistant.search.web import chain as search_chain
-from research_assistant.writer import chain as writer_chain
-chain_notypes = (
- RunnablePassthrough().assign(research_summary=search_chain) | writer_chain
-)
-class InputType(BaseModel):
- question: str
-chain = chain_notypes.with_types(input_type=InputType)

 from langchain_core.pydantic_v1 import BaseModel
 from langchain_core.runnables import RunnablePassthrough
+from research_assistant.search.web import get_search_chain
+from research_assistant.writer import get_writer_chain
+from langchain.llms.base import BaseLLM
+from langchain.schema.runnable import Runnable
+def get_chain(search_llm: BaseLLM, writer_llm: BaseLLM) -> Runnable:
+ chain_notypes = RunnablePassthrough().assign(
+ research_summary=get_search_chain(search_llm),
+ ) | get_writer_chain(writer_llm)
+ class InputType(BaseModel):
+ question: str
+ return chain_notypes.with_types(input_type=InputType)

langchain-streamlit-demo/research_assistant/search/web.py CHANGED Viewed

@@ -3,7 +3,7 @@ from typing import Any
 import requests
 from bs4 import BeautifulSoup
-from langchain.chat_models import ChatOpenAI
 from langchain.prompts import ChatPromptTemplate
 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
 from langchain.utilities import DuckDuckGoSearchAPIWrapper
@@ -130,25 +130,6 @@ Using the above text, answer in short the following question:
 if the question cannot be answered using the text, imply summarize the text. Include all factual information, numbers, stats etc if available.""" # noqa: E501
 SUMMARY_PROMPT = ChatPromptTemplate.from_template(SUMMARY_TEMPLATE)
-scrape_and_summarize: Runnable[Any, Any] = (
- RunnableParallel(
- {
- "question": lambda x: x["question"],
- "text": lambda x: scrape_text(x["url"])[:10000],
- "url": lambda x: x["url"],
- },
- )
- | RunnableParallel(
- {
- "summary": SUMMARY_PROMPT | ChatOpenAI(temperature=0) | StrOutputParser(),
- "url": lambda x: x["url"],
- },
- )
- | RunnableLambda(lambda x: f"Source Url: {x['url']}\nSummary: {x['summary']}")
-)
-multi_search = get_links | scrape_and_summarize.map() | (lambda x: "\n".join(x))
 def load_json(s):
  try:
@@ -157,24 +138,41 @@ def load_json(s):
  return {}
-search_query = SEARCH_PROMPT | ChatOpenAI(temperature=0) | StrOutputParser() | load_json
-choose_agent = (
- CHOOSE_AGENT_PROMPT | ChatOpenAI(temperature=0) | StrOutputParser() | load_json
-)
-get_search_queries = (
- RunnablePassthrough().assign(
- agent_prompt=RunnableParallel({"task": lambda x: x})
- | choose_agent
- | (lambda x: x.get("agent_role_prompt")),
  )
- | search_query
-)
-chain = (
- get_search_queries
- | (lambda x: [{"question": q} for q in x])
- | multi_search.map()
- | (lambda x: "\n\n".join(x))
-)

 import requests
 from bs4 import BeautifulSoup
+from langchain.llms.base import BaseLLM
 from langchain.prompts import ChatPromptTemplate
 from langchain.retrievers.tavily_search_api import TavilySearchAPIRetriever
 from langchain.utilities import DuckDuckGoSearchAPIWrapper
 if the question cannot be answered using the text, imply summarize the text. Include all factual information, numbers, stats etc if available.""" # noqa: E501
 SUMMARY_PROMPT = ChatPromptTemplate.from_template(SUMMARY_TEMPLATE)
 def load_json(s):
  try:
  return {}
+def get_search_chain(model: BaseLLM) -> Runnable:
+ scrape_and_summarize: Runnable[Any, Any] = (
+ RunnableParallel(
+ {
+ "question": lambda x: x["question"],
+ "text": lambda x: scrape_text(x["url"])[:10000],
+ "url": lambda x: x["url"],
+ },
+ )
+ | RunnableParallel(
+ {
+ "summary": SUMMARY_PROMPT | model | StrOutputParser(),
+ "url": lambda x: x["url"],
+ },
+ )
+ | RunnableLambda(lambda x: f"Source Url: {x['url']}\nSummary: {x['summary']}")
  )
+ multi_search = get_links | scrape_and_summarize.map() | (lambda x: "\n".join(x))
+ search_query = SEARCH_PROMPT | model | StrOutputParser() | load_json
+ choose_agent = CHOOSE_AGENT_PROMPT | model | StrOutputParser() | load_json
+ get_search_queries = (
+ RunnablePassthrough().assign(
+ agent_prompt=RunnableParallel({"task": lambda x: x})
+ | choose_agent
+ | (lambda x: x.get("agent_role_prompt")),
+ )
+ | search_query
+ )
+ return (
+ get_search_queries
+ | (lambda x: [{"question": q} for q in x])
+ | multi_search.map()
+ | (lambda x: "\n\n".join(x))
+ )

langchain-streamlit-demo/research_assistant/writer.py CHANGED Viewed

@@ -1,7 +1,8 @@
-from langchain.chat_models import ChatOpenAI
 from langchain.prompts import ChatPromptTemplate
 from langchain_core.output_parsers import StrOutputParser
 from langchain_core.runnables import ConfigurableField
 WRITER_SYSTEM_PROMPT = "You are an AI critical thinker research assistant. Your sole purpose is to write well written, critically acclaimed, objective and structured reports on given text." # noqa: E501
@@ -50,7 +51,6 @@ Use appropriate Markdown syntax to format the outline and ensure readability.
 Please do your best, this is very important to my career.""" # noqa: E501
-model = ChatOpenAI(temperature=0)
 prompt = ChatPromptTemplate.from_messages(
  [
  ("system", WRITER_SYSTEM_PROMPT),
@@ -72,4 +72,7 @@ prompt = ChatPromptTemplate.from_messages(
  ],
  ),
 )
-chain = prompt | model | StrOutputParser()

 from langchain.prompts import ChatPromptTemplate
 from langchain_core.output_parsers import StrOutputParser
 from langchain_core.runnables import ConfigurableField
+from langchain.llms.base import BaseLLM
+from langchain.schema.runnable import Runnable
 WRITER_SYSTEM_PROMPT = "You are an AI critical thinker research assistant. Your sole purpose is to write well written, critically acclaimed, objective and structured reports on given text." # noqa: E501
 Please do your best, this is very important to my career.""" # noqa: E501
 prompt = ChatPromptTemplate.from_messages(
  [
  ("system", WRITER_SYSTEM_PROMPT),
  ],
  ),
 )
+def get_writer_chain(model: BaseLLM) -> Runnable:
+ return prompt | model | StrOutputParser()