Spaces:
Sleeping
Sleeping
File size: 3,218 Bytes
e295b9d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 |
import streamlit as st
import numpy as np
import pandas as pd
from PIL import Image
import base64
from io import BytesIO
from sentence_transformers import SentenceTransformer, util
import faiss
df = pd.read_csv('/home/valera/ds_bootcamp/ds-phase-2/11-nn-ext/progect/movies.csv')
@st.cache_resource
def load_model():
return SentenceTransformer("cointegrated/rubert-tiny2")
model = load_model()
@st.cache_resource
def load_vector():
return model.encode(df["description"])
embeddings = load_vector()
index = faiss.IndexFlatIP(embeddings.shape[1])
index.add(embeddings)
# Функция для поиска фильмов по сходству
def find_similar_movies(user_input, top_n=5):
user_input = model.encode(user_input)
user_input = user_input.reshape(1,-1)
distances, indices = index.search(user_input, top_n)
return list(indices[0])
# Загрузить изображение из файла
img = Image.open('/home/valera/ds_bootcamp/ds-phase-2/11-nn-ext/progect/_-fotor.jpg')
buffered = BytesIO()
img.save(buffered, format="JPEG")
img_str = base64.b64encode(buffered.getvalue()).decode()
st.markdown(f"""
<style>
.stApp {{
background-image: url(data:image/jpg;base64,{img_str});
background-size: cover;
}}
</style>
""", unsafe_allow_html=True)
random_digits = np.random.choice(len(df), size=5, replace=False)
# Создать текстовое поле для ввода названия фильма
title = st.text_input('Что хотите посмотреть сегодня?')
if st.button('Подобрать фильм'):
# Использование функции
similar_movies = find_similar_movies(title)
for i in similar_movies:
st.title('Название фильма:')
st.header(df['movie_title'][i])
st.image('http://'+ df['img_url'][i])
st.title('Описание:')
st.write(df['description'][i])
st.title('Жанр:')
st.write("Нет данных" if pd.isna(df['genres'].iloc[i]) else df['genres'][i] )
st.title('Оценка')
imb = 'Нет оценки' if df['imdb'][i] == 0 else str(df['imdb'][i])
kinopoisk = 'Нет оценки' if df['kinopoisk'][i] == 0 else str(df['kinopoisk'][i])
st.write(f'Рейтинг imdb: {imb}')
st.write(f'Рейтинг кинопоиск: {kinopoisk}')
st.title('-'*45)
if st.button('Выбрать случайно'):
for i in random_digits:
st.title('Название фильма:')
st.header(df['movie_title'][i])
st.image('http://'+ df['img_url'][i])
st.title('Описание:')
st.write(df['description'][i])
st.title('Жанр:')
st.write("Нет данных" if pd.isna(df['genres'].iloc[i]) else df['genres'][i] )
st.title('Оценка')
imb = 'Нет оценки' if df['imdb'][i] == 0 else str(df['imdb'][i])
kinopoisk = 'Нет оценки' if df['kinopoisk'][i] == 0 else str(df['kinopoisk'][i])
st.write(f'Рейтинг imdb: {imb}')
st.write(f'Рейтинг кинопоиск: {kinopoisk}')
st.title('-'*45)
|