Spaces:

Kyudan
/

SIF2025_demo

Running

SIF2025_demo / translate_utils.py

Kyudan

update

f7dcae3 7 months ago

656 Bytes

	from transformers import MarianMTModel, MarianTokenizer

	# 1) MarianMT 모델과 토크나이저 불러오기
	model_name = "Helsinki-NLP/opus-mt-ko-en"
	tokenizer = MarianTokenizer.from_pretrained(model_name)
	model = MarianMTModel.from_pretrained(model_name)

	# 2) 번역 함수 예시
	def translate_ko_to_en(text: str) -> str:
	# 입력 문장을 토큰화
	inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
	# 모델로 추론
	translated = model.generate(**inputs)
	# 토큰을 다시 문장으로 디코딩
	translation = tokenizer.batch_decode(translated, skip_special_tokens=True)
	return translation[0]