Spaces:
Sleeping
Sleeping
import streamlit as st | |
import pandas as pd | |
import numpy as np | |
import matplotlib.pyplot as plt | |
# from phik.report import plot_correlation_matrix | |
from PIL import Image | |
#membuat function untuk nantinya dipanggil di app.py | |
def run(): | |
st.title('Explaration Data Analysis') | |
st.subheader ('Data Frame Hasil Model Prediksi') | |
#Memanggil data csv | |
df= pd.read_csv(r'hasil_predik.csv') | |
#menampilakn 5 data teratas | |
st.write('Menampilkan Head dataframe hasil prediksi') | |
st.table(df.head()) | |
st.write('Menampilkan Tail dataframe hasil prediksi') | |
st.table(df.tail()) | |
#menampilakn phik matrix | |
st.subheader ('phik correlation matrix') | |
image = Image.open('model.jpg') | |
st.write('') | |
st.image(image, caption='Heatmap Correlation') | |
st.write('''Berdasarkan correlation matrix diatas, dipilih beberapa kolom yang memiliki korelasi cukup tinggi dengan target DEATH_EVENT yang kemudian nantinya digunakan untuk variabel X dan Y pada modelling. Kolom tersebut diantaranya adalah sebagai berikut: | |
Serum Creatinine berkorelasi dengan target DEATH_EVENT sebesar : 0.294278 | |
Age berkorelasi dengan target DEATH_EVENT sebesar : 0.253581 | |
High Blood Pressure berkorelasi dengan target DEATH_EVENT sebesar : 0.079351 | |
Anaemia berkorelasi dengan target DEATH_EVENT sebesar : 0.066270 | |
Creatinine Phosphokinase berkorelasi dengan target DEATH_EVENT sebesar : 0.062728''') | |
#menampilakn phik matrix | |
st.subheader ('Hasil seleksi fitur menggunakan Random Forest') | |
image = Image.open('fitur.jpg') | |
st.image(image, caption='Hasil Seleksi Pemilihan FItur Mengunakan Random Forest') | |
st.write('''Korelasi antara berbagai parameter kesehatan dengan DEATH_EVENT (kematian akibat penyakit jantung) dapat memberikan wawasan tentang faktor-faktor yang mempengaruhi prognosis pasien dengan penyakit jantung. | |
Berikut adalah kemungkinan korelasi yang kuat antara parameter yang Anda sebutkan dengan DEATH_EVENT: | |
- Ejection Fraction: Ejection fraction (persentase darah yang dipompa oleh jantung setiap kali berdetak) kemungkinan memiliki korelasi negatif yang kuat dengan DEATH_EVENT. Semakin rendah ejection fraction, semakin tinggi risiko kematian. | |
- Serum Creatinine: Serum creatinine (tingkat kreatinin dalam darah, yang mencerminkan fungsi ginjal) kemungkinan memiliki korelasi positif yang kuat dengan DEATH_EVENT. Tingkat serum creatinine yang tinggi dapat menunjukkan gangguan fungsi ginjal yang berpotensi mempengaruhi prognosis. | |
- Time : Periode tindak lanjut (dalam hari), Lama perawatan untuk penyakit jantung koroner (PJK) bisa menjadi salah satu faktor yang mempengaruhi bertahan hidup pasien, namun, perlu diingat bahwa hal ini sangat kompleks dan dipengaruhi oleh banyak faktor lainnya. | |
Penting untuk diingat bahwa hasil korelasi tidak selalu menunjukkan hubungan sebab-akibat, dan interpretasi yang lebih mendalam memerlukan analisis statistik yang lebih komprehensif dan pengetahuan medis yang tepat. | |
Selain itu, faktor-faktor lain juga bisa berpengaruh terhadap DEATH_EVENT, dan analisis lebih lanjut mungkin diperlukan untuk memahami sepenuhnya hubungan antara variabel-variabel ini.''') | |
#menampilkan penjelasan | |
with st.expander(' ### Explanation'): | |
st.caption(""" Pemilihan fitur menggunakan Random Forest umum dilakukan karena beberapa alasan: | |
- Kepentingan Fitur (Feature Importance): Random Forest memberikan skor kepentingan untuk setiap fitur. Skor ini membantu memahami fitur mana yang memiliki pengaruh lebih besar dalam membuat prediksi. Fitur dengan skor kepentingan yang tinggi cenderung memiliki pengaruh yang lebih besar pada kinerja model. | |
- Menangani Non-linieritas dan Interaksi: Random Forest dapat menangkap hubungan non-linier dan interaksi antar fitur, yang penting karena data dunia nyata sering menunjukkan hubungan yang kompleks yang mungkin tidak linear. | |
- Tahan Terhadap Overfitting: Random Forest cenderung lebih tahan terhadap overfitting dibandingkan dengan model yang lebih kompleks. Ini membuatnya lebih dapat diandalkan untuk pemilihan fitur dalam situasi di mana overfitting bisa menjadi masalah. | |
""" ) | |