SearchGPT

Paused

App Files Files Community

Shreyas094 commited on Jul 6, 2024

Commit

1dc5b0f

verified ·

1 Parent(s): 722db3d

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -0

app.py CHANGED Viewed

@@ -148,6 +148,8 @@ def google_search(term, num_results=5, lang="en", timeout=5, safe="active", ssl_
     all_results = []
     max_chars_per_page = 8000  # Limit the number of characters from each webpage to stay under the token limit
     with requests.Session() as session:
         while start < num_results:
             try:
@@ -169,17 +171,23 @@ def google_search(term, num_results=5, lang="en", timeout=5, safe="active", ssl_
                     verify=ssl_verify,
                 )
                 resp.raise_for_status()
             except requests.exceptions.RequestException as e:
                 break
             soup = BeautifulSoup(resp.text, "html.parser")
             result_block = soup.find_all("div", attrs={"class": "g"})
             if not result_block:
                 break
             for result in result_block:
                 link = result.find("a", href=True)
                 if link:
                     link = link["href"]
                     try:
                         webpage = session.get(link, headers=headers, timeout=timeout)
                         webpage.raise_for_status()
@@ -187,11 +195,26 @@ def google_search(term, num_results=5, lang="en", timeout=5, safe="active", ssl_
                         if len(visible_text) > max_chars_per_page:
                             visible_text = visible_text[:max_chars_per_page] + "..."
                         all_results.append({"link": link, "text": visible_text})
                     except requests.exceptions.RequestException as e:
                         all_results.append({"link": link, "text": None})
                 else:
                     all_results.append({"link": None, "text": None})
             start += len(result_block)
     return all_results
 def ask_question(question, temperature, top_p, repetition_penalty, web_search):

     all_results = []
     max_chars_per_page = 8000  # Limit the number of characters from each webpage to stay under the token limit
+    print(f"Starting Google search for term: '{term}'")
     with requests.Session() as session:
         while start < num_results:
             try:
                     verify=ssl_verify,
                 )
                 resp.raise_for_status()
+                print(f"Successfully retrieved search results page (start={start})")
             except requests.exceptions.RequestException as e:
+                print(f"Error retrieving search results: {e}")
                 break
             soup = BeautifulSoup(resp.text, "html.parser")
             result_block = soup.find_all("div", attrs={"class": "g"})
             if not result_block:
+                print("No results found on this page")
                 break
+            print(f"Found {len(result_block)} results on this page")
             for result in result_block:
                 link = result.find("a", href=True)
                 if link:
                     link = link["href"]
+                    print(f"Processing link: {link}")
                     try:
                         webpage = session.get(link, headers=headers, timeout=timeout)
                         webpage.raise_for_status()
                         if len(visible_text) > max_chars_per_page:
                             visible_text = visible_text[:max_chars_per_page] + "..."
                         all_results.append({"link": link, "text": visible_text})
+                        print(f"Successfully extracted text from {link}")
                     except requests.exceptions.RequestException as e:
+                        print(f"Error retrieving webpage content: {e}")
                         all_results.append({"link": link, "text": None})
                 else:
+                    print("No link found for this result")
                     all_results.append({"link": None, "text": None})
             start += len(result_block)
+    print(f"Search completed. Total results: {len(all_results)}")
+    print("Search results:")
+    for i, result in enumerate(all_results, 1):
+        print(f"Result {i}:")
+        print(f"  Link: {result['link']}")
+        if result['text']:
+            print(f"  Text: {result['text'][:100]}...")  # Print first 100 characters
+        else:
+            print("  Text: None")
+    print("End of search results")
     return all_results
 def ask_question(question, temperature, top_p, repetition_penalty, web_search):