Spaces:

powerpuf-bot
/

dataxet-chatbot

Sleeping

Sirinoot commited on Feb 21, 2024

Commit

382dab4

verified ·

1 Parent(s): f6a46b7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -156,15 +156,6 @@ def predict_test(model, tokenizer, embedding_model, df, question, index):  # sen
     mostSimContext = re.sub(r'\s+', ' ', mostSimContext)
     segments = sent_tokenize(mostSimContext, engine="crfcut")
-    #=====add
-    if (len(segments)==1):
-        segments = ' '.join(segments)
-        segments = segments.split('และ')
-        segments = [segment.split('หรือ') for segment in segments]
-        segments = [sentence for segment in segments for sentence in segment]
-    #=====end
     segments_index = set_index(get_embeddings(embedding_model,segments))
     _distances,_indices = faiss_search(segments_index, question_vector)

     mostSimContext = re.sub(r'\s+', ' ', mostSimContext)
     segments = sent_tokenize(mostSimContext, engine="crfcut")
     segments_index = set_index(get_embeddings(embedding_model,segments))
     _distances,_indices = faiss_search(segments_index, question_vector)