Spaces:

osanchik
/

PicFinder

Runtime error

App Files Files Community

osanchik commited on Jun 15, 2023

Commit

63d858e

1 Parent(s): 6e7628d

added search for release 2

Browse files

Files changed (5) hide show

app.py +10 -4
dataframe.py +12 -0
main.py +25 -2
model.py +60 -0
setup.py +2 -2

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import streamlit as st
 from main import *
 from setup import *
@@ -26,7 +27,12 @@ downlad_images()
 st.title('Find my pic!')
 search_request = st.text_input('', 'Search ...')
-if st.button('Find!'):
-    search_result = search(search_request)
-    display(search_request, search_result)

 import streamlit as st
+import pandas as pd
 from main import *
 from setup import *
 st.title('Find my pic!')
 search_request = st.text_input('', 'Search ...')
+# if st.button('Find Relsease 1!'):
+#     search_result = search1(search_request)
+#     display(search_request, search_result)
+if st.button('Find Relsease 2!'):
+    search_result = search2(search_request)
+    for item in search_result :
+        st.write(item)

dataframe.py ADDED Viewed

	@@ -0,0 +1,12 @@

+import pandas as pd
+import numpy as np
+def get_image_data() :
+    # flickr = pd.read_csv('data/results.csv', sep='|')
+    image_data_df = pd.read_csv ('data/output2.csv')
+    image_data_df['text_embeddings'] = image_data_df['text_embeddings'].apply(lambda x: np.fromstring(x[2:-2], sep=' ')).values
+    image_data_df['text_embeddings'] = image_data_df['text_embeddings'].apply(lambda x: np.reshape(x, (1, -1)))
+    return image_data_df

main.py CHANGED Viewed

@@ -1,5 +1,9 @@
 import random
 images = ["Girl.jpg",
           "Cat In Hat.jpg",
@@ -17,9 +21,28 @@ images = ["Girl.jpg",
-def search(search_prompt : str):
     """
     Given a search_prompt, return an array of pictures to display
     """
-    return  [ (images[i], images[i].split('.')[0]) for i in random.sample(range(len(images)), 4) ]

 import random
+import torch
+from dataframe import *
+from model import *
 images = ["Girl.jpg",
           "Cat In Hat.jpg",
+def search1(search_prompt : str):
     """
     Given a search_prompt, return an array of pictures to display
     """
+    return  [ (images[i], images[i].split('.')[0]) for i in random.sample(range(len(images)), 4) ]
+def search2(search_prompt : str) :
+    # Set the device
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    # Define the model ID
+    model_ID = "openai/clip-vit-base-patch32"
+    # Get model, processor & tokenizer
+    model, processor, tokenizer = get_model_info(model_ID, device)
+    image_data_df = get_image_data()
+    return get_top_N_images(search_prompt,
+                            data = image_data_df,
+                            model=model, tokenizer=tokenizer,
+                            device = device,
+                            top_K=4)

model.py ADDED Viewed

	@@ -0,0 +1,60 @@

+from transformers import CLIPProcessor, CLIPModel, CLIPTokenizer
+from sklearn.metrics.pairwise import cosine_similarity
+from dataframe  import *
+def get_model_info(model_ID, device):
+    # Save the model to device
+	model = CLIPModel.from_pretrained(model_ID).to(device)
+ 	# Get the processor
+	processor = CLIPProcessor.from_pretrained(model_ID)
+    # Get the tokenizer
+	tokenizer = CLIPTokenizer.from_pretrained(model_ID)
+    # Return model, processor & tokenizer
+	return model, processor, tokenizer
+def get_single_text_embedding(text, model, tokenizer, device):
+    inputs = tokenizer(text, return_tensors = "pt", max_length=77, truncation=True).to(device)
+    text_embeddings = model.get_text_features(**inputs)
+    # convert the embeddings to numpy array
+    embedding_as_np = text_embeddings.cpu().detach().numpy()
+    return embedding_as_np
+def df_to_array(result_df) :
+    return [str(result_df['image_name'][i]) for i in range(len(result_df))]
+def get_top_N_images(query,
+                     data,
+                     model, tokenizer,
+                     device,
+                     top_K=4,
+                     search_criterion="text"):
+   # Text to image Search
+   if (search_criterion.lower() == "text"):
+     query_vect = get_single_text_embedding(query, model, tokenizer, device)
+#    # Image to image Search
+#    else:
+#      query_vect = get_single_image_embedding(query)
+   # Relevant columns
+   revevant_cols = ["comment", "image_name", "cos_sim"]
+   # Run similarity Search
+   data["cos_sim"] = data["text_embeddings"].apply(lambda x: cosine_similarity(query_vect, x))# line 17
+   data["cos_sim"] = data["cos_sim"].apply(lambda x: x[0][0])
+   data_sorted = data.sort_values(by='cos_sim', ascending=False)
+   non_repeated_images = ~data_sorted["image_name"].duplicated()
+   most_similar_articles = data_sorted[non_repeated_images].head(top_K)
+   """
+   Retrieve top_K (4 is default value) articles similar to the query
+   """
+   result_df = most_similar_articles[revevant_cols].reset_index()
+   return df_to_array(result_df)

setup.py CHANGED Viewed

@@ -2,8 +2,8 @@
 import os
 import streamlit as st
-from huggingface_hub import hf_hub_url, cached_download
-from huggingface_hub.archive import unpack_archive
 def downlad_images() :

 import os
 import streamlit as st
+# from huggingface_hub import hf_hub_url, cached_download
+# from huggingface_hub.archive import unpack_archive
 def downlad_images() :