Spaces:

JoJosmin
/

itda-segmentation_1020ver

Sleeping

App Files Files Community

JoJosmin commited on Oct 27, 2024

Commit

196c895

verified ·

1 Parent(s): 8392151

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -23

app.py CHANGED Viewed

@@ -111,38 +111,32 @@ def segment_clothing(img, clothes=["Hat", "Upper-clothes", "Skirt", "Pants", "Dr
 #    return structured_results
-def get_all_embeddings_from_collection(collection):
-    # 컬렉션에서 모든 임베딩 벡터를 가져옵니다.
-    # 이 경우 collection 객체는 embeddings 속성 포함을 지정해 호출합니다.
-    all_embeddings_data = collection.get(include=['embeddings'])
-    # 모든 임베딩 벡터를 numpy 배열로 변환합니다.
-    all_embeddings = np.array(all_embeddings_data['embeddings'])
-    return all_embeddings
 def find_similar_images(query_embedding, collection, top_k=5):
-    # 데이터베이스 임베딩 정규화
-    database_embeddings = get_all_embeddings_from_collection(collection)
-    database_embeddings = normalize(database_embeddings, axis=1)
-    # 쿼리 임베딩 정규화
-    query_embedding = normalize(query_embedding.reshape(1, -1), axis=1)
-    #query_embedding = query_embedding.reshape(1, -1)  # Reshape to 2D array for ChromaDB
     results = collection.query(
-        query_embeddings=query_embedding,
         n_results=top_k,
-        include=['metadatas', 'distances']
     )
     top_metadatas = results['metadatas'][0]
-    top_distances = results['distances'][0]
     structured_results = []
-    for metadata, distance in zip(top_metadatas, top_distances):
         structured_results.append({
             'info': metadata,
-            'similarity': 1 - distance
         })
     return structured_results

 #    return structured_results
 def find_similar_images(query_embedding, collection, top_k=5):
+    # 데이터베이스 임베딩을 가져옵니다.
     results = collection.query(
+        query_embeddings=query_embedding.reshape(1, -1),  # 2D 배열로 변환
         n_results=top_k,
+        include=['metadatas', 'embeddings']
     )
+    # 메타데이터와 임베딩을 추출합니다.
     top_metadatas = results['metadatas'][0]
+    top_embeddings = np.array(results['embeddings'][0])  # numpy 배열로 변환
+    # 쿼리 임베딩 정규화
+    query_embedding_normalized = normalize(query_embedding.reshape(1, -1), axis=1)
+    # 임베딩 정규화
+    top_embeddings_normalized = normalize(top_embeddings, axis=1)
+    # 코사인 유사도 계산
+    similarities = cosine_similarity(query_embedding_normalized, top_embeddings_normalized).flatten()
     structured_results = []
+    for metadata, similarity in zip(top_metadatas, similarities):
         structured_results.append({
             'info': metadata,
+            'similarity': similarity  # 유사도는 이미 계산된 값
         })
     return structured_results