--- license: cc-by-nc-4.0 base_model: - google/gemma-2-2b-it --- # Gemma-2-2b 초등학생 글 변환기 ## Model Description - Gemma2-2b 한국 초등학생 글 변환기는 입력한 글을 초등학생이 쓴 것 같은 글로 변환해 주는 모델입니다. - Gemma2-2b-it 모델을 base model로 사용하였고 LoRA기법을 사용하여 효율적으로 fine-tuning 하였습니다. ## Usage ``` import transformers import torch from huggingface_hub import notebook_login notebook_login() BASE_MODEL = "skwh54/Gemma-2-2b-it-elementary-style-document" model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map={"":0}) tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL) ``` ## Training data - [korean_smile_style_dataset](https://github.com/smilegate-ai/korean_smile_style_dataset)을 사용하였습니다. - 본 데이터는 Smilegate AI에서 공개하는 한국어 문체 스타일 변환 "SmileStyle" 데이터셋입니다. - 여러 스타일의 문체가 존재하며 이 중에서 formal과 choding 스타일의 데이터만을 추출하여 사용하였습니다.