Spaces:

KotVasily
/

myfirspace

Sleeping

App Files Files Community

myfirspace / model.py

KotVasily

Add application file

d39b93e 3 months ago

raw

history blame contribute delete

5.06 kB

	import pandas as pd
	import tensorflow as tf
	import pickle
	import plotly.express as px
	import os
	import numpy as np

	from stock_and import GetNewData

	class Model:
	def __init__(self, stock_name, model_name) -> None:
	"""Этот класс делает прогнозирования, выводит графики, рассчитывает важность признаков."""
	self.stock_name = stock_name # Название
	self.features = ['lag_25', 'lag_34','lag_33','lag_26','lag_32','lag_31','lag_30','lag_29','lag_27','sentiment_neutral', 'lag_28',
	'sentiment_positive','sentiment_negative', 'month','day'] # Фичи для модели
	self.model_name = model_name # Название модели

	# Загрузка моделей
	if model_name == 'NN':
	self.model = tf.keras.models.load_model(f'models/nn_predict_1day_ver2_{stock_name}.h5', custom_objects={'mae': tf.keras.metrics.MeanAbsoluteError()})

	if model_name == 'LinearRegression':
	with open(os.path.join('models', f'linear_predict_1day_ver2_{stock_name}.pkl'), 'rb') as f:
	self.model = pickle.load(f)

	if model_name == 'LGB':
	with open(os.path.join('models', f'lgb_predict_1day_ver2_{stock_name}.pkl'), 'rb') as f:
	self.model = pickle.load(f)

	def generate_dataset(self, stock_name, num_day):
	"""Парсим датасет, добавляем новые row для прогонза"""
	merged_df, string = GetNewData(stock_name).get_full_data() # Тут мы получаем датасет с новостями и акциями

	# Создаем датасет с дополнительными строками
	last_date = merged_df['DATE'].max()
	new_date_rng = pd.date_range(start=last_date + pd.Timedelta(hours=1), periods=24 * num_day , freq='H')

	new_df = pd.DataFrame(new_date_rng, columns=['DATE'])
	new_df['month'] = new_df['DATE'].dt.month
	new_df['day'] = new_df['DATE'].dt.day

	for c in self.features:
	last_value = merged_df[c].values[-24 * num_day :]
	new_df[c] = last_value

	# Объединяем датасет
	merged_df_new = pd.concat([merged_df, new_df[self.features+['DATE']]], ignore_index=True)
	return merged_df_new, string

	def predict(self, num_day):
	# Создаем прогнозы, важности признаков
	merged_df, string = self.generate_dataset(self.stock_name, num_day) # Парсим датасет

	if self.model_name == 'NN':
	importance = np.abs(self.model.layers[0].get_weights()[0])
	importance = np.mean(importance, axis=1)
	df_weighted = merged_df[self.features].ffill().bfill()[-num_day24:] importance

	if self.model_name == 'LinearRegression':
	df_weighted = merged_df[self.features].ffill().bfill()[-num_day24:] self.model.coef_

	if self.model_name == 'LGB':
	df_weighted = merged_df[self.features].ffill().bfill()[-num_day24:] self.model.feature_importances_

	average_values = df_weighted.mean(axis=0).abs().sort_values(ascending=False)
	average_values_filtered = average_values.drop('lag_25')

	total_sum = average_values_filtered.sum()
	average_values_percentage = (average_values_filtered / total_sum) * 100

	string += '\n Самые полезные признаки для прогнозов: \n'

	for f, v in zip(average_values_percentage.index, average_values_percentage.values):
	string += f'- {f}: важность = {v:.2f}%\n'

	if self.model_name in ['LinearRegression', 'LGB']:
	return pd.DataFrame({
	'predict': self.model.predict(merged_df[self.features].ffill().bfill().values),
	'DATE': merged_df['DATE'].values,
	'CLOSE': merged_df['CLOSE'].values
	}), string

	else:
	return pd.DataFrame({
	'predict': self.model.predict(merged_df[self.features].ffill().bfill().values)[:, 0],
	'DATE': merged_df['DATE'].values,
	'CLOSE': merged_df['CLOSE'].values
	}), string

	def plot_predict(self, predict, add_smoothing):
	predict = predict[-24*12:]

	scaling_factor = predict['CLOSE'].mean() / predict['predict'].mean()
	scaled_preds = predict['predict'] * scaling_factor

	fig = px.line(predict, x=predict.DATE, y='CLOSE', labels={'value': 'Цена'}, title='CLOSE')
	fig.add_scatter(x=predict.DATE, y=scaled_preds, mode='lines', name='Predict', opacity=0.7)

	if add_smoothing:
	smoothed_preds = pd.Series(scaled_preds).ewm(3).mean()
	fig.add_scatter(x=predict.DATE, y=smoothed_preds, mode='lines', name='Сглаженные предсказания', opacity=0.7)

	fig.update_layout(xaxis=dict(type='category'))
	return fig