kai-law2

Running

seawolf2357 commited on Jun 19

Commit

c1c1dea

•

1 Parent(s): 6eaab32

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,9 +7,6 @@ import subprocess
 from datasets import load_dataset
 import pandas as pd
 from fuzzywuzzy import process
 # 현재 작업 디렉토리 출력
 print("Current Working Directory:", os.getcwd())
@@ -30,12 +27,17 @@ else:
 def load_optimized_dataset(data_files):
     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
     # 확인을 위한 데이터 샘플 출력
-    logging.debug(f"Data sample: {full_data[['사건명', '사건번호', '판시사항']].head()}")
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
     summary_to_number = full_data.groupby('판시사항')['사건번호'].apply(list).to_dict()
     number_to_fulltext = full_data.set_index('사건번호')['전문'].to_dict()
     return name_to_number, summary_to_number, number_to_fulltext
 name_to_number, summary_to_number, number_to_fulltext = load_optimized_dataset(data_files)
@@ -147,4 +149,4 @@ async def generate_response(message):
 if __name__ == "__main__":
     discord_client = MyClient(intents=intents)
-    discord_client.run(os.getenv('DISCORD_TOKEN'))

 from datasets import load_dataset
 import pandas as pd
 from fuzzywuzzy import process
 # 현재 작업 디렉토리 출력
 print("Current Working Directory:", os.getcwd())
 def load_optimized_dataset(data_files):
     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
     # 확인을 위한 데이터 샘플 출력
+    print(full_data[['사건명', '사건번호', '판시사항']].head())  # '판시사항' 필드의 데이터 샘플 출력
+    logging.debug(f"Columns in dataset: {full_data.columns}")
+    logging.debug(f"Sample data from '판시사항': {full_data['판시사항'].dropna().head()}")
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
     summary_to_number = full_data.groupby('판시사항')['사건번호'].apply(list).to_dict()
     number_to_fulltext = full_data.set_index('사건번호')['전문'].to_dict()
     return name_to_number, summary_to_number, number_to_fulltext
 name_to_number, summary_to_number, number_to_fulltext = load_optimized_dataset(data_files)
 if __name__ == "__main__":
     discord_client = MyClient(intents=intents)
+    discord_client.run(os.getenv('DISCORD_TOKEN'))