metadata
language:
- ko
metrics:
- bleu
pipeline_tag: translation
๐ ์ ์ฃผ์ด, ํ์ค์ด ์๋ฐฉํฅ ๋ฒ์ญ ๋ชจ๋ธ (Jeju-Standard Bidirectional Translation Model)
1. Introduction
๐งโ๐คโ๐งMember
- Bitamin 12๊ธฐ : ๊ตฌ์คํ, ์ด์ํ, ์ด์๋ฆฐ
- Bitamin 13๊ธฐ : ๊น์ค์, ๊น์ฌ๊ฒธ, ์ดํ์
Github Link
Parent Model
- gogamza/kobart-base-v2
- https://huggingface.co/gogamza/kobart-base-v2
How to use this Model
- ๋ฌธ์ฅ ์ ๋ ฅ ์ ์ ๋ฐฉํฅ์ ๋ง๊ฒ [์ ์ฃผ] or [ํ์ค] ํ ํฐ์ ์ ๋ ฅ ํ ๋ฌธ์ฅ ์ ๋ ฅ
- ex1) ์ ์ฃผ์ด -> ํ์ค์ด : [์ ์ฃผ] ์๋ ํ์๊ฝ -> ์๋ ํ์ธ์
- ex2) ํ์ค์ด -> ์ ์ฃผ์ด : [ํ์ค] ์๋ ํ์ธ์ -> ์๋ ํ์๊ฝ
2. Dataset - ์ฝ 93๋ง ๊ฐ์ ํ
- AI-Hub (์ ์ฃผ์ด ๋ฐํ ๋ฐ์ดํฐ + ์ค๋ ์ธต ๋ฐฉ์ธ ๋ฐํ ๋ฐ์ดํฐ)
- Github (์นด์นด์ค๋ธ๋ ์ธ JIT ๋ฐ์ดํฐ)
- ๊ทธ ์ธ
- ์ ์ฃผ์ด์ฌ์ ๋ฐ์ดํฐ (์ ์ฃผ๋์ฒญ ํํ์ด์ง์์ ํฌ๋กค๋ง)
- ๊ฐ์ฌ ๋ฒ์ญ ๋ฐ์ดํฐ (๋ญ๋ญํ๋งจ ์ ํ๋ธ์์ ์ผ์ผ์ด ์์ง)
- ๋์ ๋ฐ์ดํฐ (์ ์ฃผ๋ฐฉ์ธ ๊ทธ ๋ง๊ณผ ๋ฉ, ๋ถ์๋๋ ์ง๊บผ์ ธ๋ ๋์์์ ์ผ์ผ์ด ์์ง)
- 2018๋ ๋ ์ ์ฃผ์ด ๊ตฌ์ ์๋ฃ์ง (์ผ์ผ์ด ์์ง - ํ๊ฐ์ฉ ๋ฐ์ดํฐ๋ก ์ฌ์ฉ)
3. Hyper Parameters
- Epoch : 3 epochs
- Learning Rate : 2e-5
- Weight Decay=0.01
- Batch Size : 32
4. Bleu Score
2018 ์ ์ฃผ์ด ๊ตฌ์ ์๋ฃ์ง ๋ฐ์ดํฐ ๊ธฐ์ค
- ์ ์ฃผ์ด -> ํ์ค์ด : 0.76
- ํ์ค์ด -> ์ ์ฃผ์ด : 0.5
AI-Hub ์ ์ฃผ์ด ๋ฐํ ๋ฐ์ดํฐ์ validation data ๊ธฐ์ค
- ์ ์ฃผ์ด -> ํ์ค์ด : 0.89
- ํ์ค์ด -> ์ ์ฃผ์ด : 0.77
5. CREDIT
- ๊ตฌ์คํ : [email protected]
- ๊น์ค์ : [email protected]
- ๊น์ฌ๊ฒธ : [email protected]
- ์ด์ํ : [email protected]
- ์ด์๋ฆฐ : [email protected]
- ์ดํ์ : [email protected]