Spaces:

Kims12
/

LLMpromt

Sleeping

App Files Files Community

LLMpromt / app.py

Kims12

Update app.py

3b0e559 verified about 1 month ago

raw

history blame contribute delete

No virus

5.39 kB

	import gradio as gr
	import random
	import os
	import pandas as pd
	from huggingface_hub import InferenceClient

	# 모델을 하드코딩으로 설정
	HARD_CODED_MODEL = "CohereForAI/c4ai-command-r-plus"

	def create_client(model_name):
	return InferenceClient(model_name, token=os.getenv("HF_TOKEN"))

	def call_api(model_input, system_message, max_tokens, temperature, top_p):
	client = create_client(HARD_CODED_MODEL)
	messages = [
	{"role": "system", "content": system_message},
	{"role": "user", "content": model_input}
	]
	random_seed = random.randint(0, 1000000)
	response = client.chat_completion(
	messages=messages,
	max_tokens=max_tokens,
	temperature=temperature,
	top_p=top_p,
	seed=random_seed
	)
	return response.choices[0].message.content

	# 긍정리뷰 분석을 위한 LLM 호출
	def analyze_positive_reviews(positive_reviews, positive_prompt, max_tokens, temperature, top_p):
	return call_api(positive_reviews, positive_prompt, max_tokens, temperature, top_p)

	# 부정리뷰 분석을 위한 LLM 호출
	def analyze_negative_reviews(negative_reviews, negative_prompt, max_tokens, temperature, top_p):
	return call_api(negative_reviews, negative_prompt, max_tokens, temperature, top_p)

	# 엑셀 파일 처리 및 긍정/부정 리뷰 추출
	def process_excel(file):
	if file is not None:
	# 엑셀 파일을 데이터프레임으로 읽기
	df = pd.read_excel(file.name)

	# 열 이름을 출력하여 확인
	print(df.columns) # 열 이름 확인: ['구매id', '리뷰날짜', '구매옵션', '리뷰내용', '리뷰점수', '수량']

	# G열에 글자수 계산하여 추가
	df['글자수'] = df['리뷰내용'].apply(lambda x: len(str(x)))

	# G열 기준 내림차순 정렬
	df = df.sort_values(by='글자수', ascending=False)

	# 긍정리뷰 10개 추출 (리뷰점수가 5, 4점이고, 글자수가 500 이하인 항목)
	positive_reviews = df[(df['리뷰점수'].isin([4, 5])) & (df['글자수'] <= 500)].head(10)

	# 부정리뷰 10개 추출 (리뷰점수가 1, 2점이고, 글자수가 500 이하인 항목)
	negative_reviews = df[(df['리뷰점수'].isin([1, 2])) & (df['글자수'] <= 500)].head(10)

	# 긍정리뷰와 부정리뷰에 필요한 컬럼만 추출 (리뷰날짜, 구매옵션, 리뷰내용)
	# 구매옵션이 없는 경우에도 빈 문자열로 처리
	positive_reviews_selected = positive_reviews.apply(
	lambda row: f"{row['리뷰날짜']}, {row['구매옵션'] if '구매옵션' in df.columns and pd.notna(row['구매옵션']) else ''}, {row['리뷰내용']}",
	axis=1
	)
	negative_reviews_selected = negative_reviews.apply(
	lambda row: f"{row['리뷰날짜']}, {row['구매옵션'] if '구매옵션' in df.columns and pd.notna(row['구매옵션']) else ''}, {row['리뷰내용']}",
	axis=1
	)

	# 긍정 및 부정 리뷰 결과를 문자열로 변환하여 각 셀에 '\n'로 구분하여 넣기
	positive_reviews_str = '\n'.join(positive_reviews_selected)
	negative_reviews_str = '\n'.join(negative_reviews_selected)

	return positive_reviews_str, negative_reviews_str
	return "엑셀 파일을 업로드하세요.", "엑셀 파일을 업로드하세요."

	title = "AI 텍스트 생성기"

	with gr.Blocks() as demo:
	gr.Markdown(f"# {title}")

	upload_excel = gr.File(label="엑셀 파일 업로드") # 엑셀 업로드를 가장 위로 이동

	# 언어 모델 선택을 하드코딩하고 UI에서 제거
	user_message = gr.Textbox(label="긍정리뷰 10개", lines=5) # 긍정리뷰 10개
	input1 = gr.Textbox(label="부정리뷰 10개", lines=5) # 부정리뷰 10개가 긍정리뷰 아래로 이동
	system_message = gr.Textbox(label="긍정 프롬프트", lines=10)
	input2 = gr.Textbox(label="부정 프롬프트", lines=10)

	with gr.Accordion("고급 설정", open=False):
	max_tokens = gr.Slider(label="Max Tokens", minimum=0, maximum=4000, value=500, step=100)
	temperature = gr.Slider(label="Temperature", minimum=0.1, maximum=1.0, value=0.75, step=0.05)
	top_p = gr.Slider(label="Top P", minimum=0.1, maximum=1.0, value=0.95, step=0.05)

	generate_btn = gr.Button("실행")

	output1 = gr.Textbox(label="긍정리뷰분석", lines=10)
	output2 = gr.Textbox(label="부정리뷰분석", lines=10)

	# 파일 업로드 후 긍정리뷰와 부정리뷰를 분석 창에 출력하고, 각 분석 결과를 리뷰 10개 입력칸에 넣기
	upload_excel.upload(fn=process_excel,
	inputs=upload_excel,
	outputs=[user_message, input1]) # 분석 결과를 긍정리뷰와 부정리뷰 입력칸에 바로 넣기

	# 긍정리뷰분석 및 부정리뷰분석을 LLM으로 추론
	generate_btn.click(fn=analyze_positive_reviews,
	inputs=[user_message, system_message, max_tokens, temperature, top_p],
	outputs=[output1])

	generate_btn.click(fn=analyze_negative_reviews,
	inputs=[input1, input2, max_tokens, temperature, top_p],
	outputs=[output2])

	demo.launch()