File size: 1,438 Bytes
920001b
 
 
 
 
 
bca00b1
 
 
920001b
bca00b1
920001b
bca00b1
 
2931845
 
 
 
bca00b1
920001b
bca00b1
 
920001b
 
bca00b1
920001b
bca00b1
 
920001b
bca00b1
920001b
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
from pathlib import Path

from llama_index.retrievers.bm25 import BM25Retriever



# from main import extract_court_decision_text
# INDEX_NAME = "bm25_retriever_long"
# TEST_CD_URL = "https://reyestr.court.gov.ua/Review/118766467"
# TEST_CD_URL = "https://reyestr.court.gov.ua/Review/118763429"
# query = extract_court_decision_text(TEST_CD_URL)

INDEX_NAME = "bm25_retriever_short"
query = (
    # "Викрадення майна, злочини, пов'язані з порушенням законодавчих норм щодо обігу та використання "
    # "документів, печаток, штампів, бланків, а також спеціальних технічних засобів "
    # "для отримання інформації та комунікаційних ліній."
    "Проникнення в житло, викрадення майна, використання підробного паспорта."
)

PERSIST_PATH = Path("Save_Index_Local")
PRINT_QUERY = True


retriever = BM25Retriever.from_persist_dir(str(PERSIST_PATH / INDEX_NAME))

if PRINT_QUERY:
    print(query)

nodes_with_score = retriever.retrieve(query)
for index, node_with_score in enumerate(nodes_with_score, start=1):
    source_title = node_with_score.node.metadata.get("title", "Невідомий заголовок")
    print(index, f"{node_with_score.score:.4f}", source_title, "\n", sep="\t")