--- license: mit language: - ko pipeline_tag: text-classification library_name: transformers --- # 텍스트 기반 발화자 인식 모델 텍스트, 특히 소설과 같이 인용 부호로 발화가 기록되어 있는 텍스트에서 대화 참여 인물을 인식하고, 타겟 인용문의 발화자를 추출하는 모델입니다. 발화자 인식은 다음의 순서로 이루어집니다. 1. 대화 참여자 인식: 전 텍스트에 걸쳐, NER을 통해 모든 대화 참여자를 인식합니다. 2. 인용문 별 인스턴스 생성: window 사이즈는 조절 가능하며, 인용문 기준 앞뒤 각각 10줄을 디폴트로 합니다. 즉 인스턴스는 21줄이 기본입니다. 3. 인용문 별 발화자 추론: 인스턴스 내에서 발화자 후보를 추리고, 발화자를 추론합니다. `GitHub Repository`: https://github.com/Novel-Transformation-for-You/service.git ![image/png](https://cdn-uploads.huggingface.co/production/uploads/6225c3f0a8218a9b862b17bb/clPpUv1gsNde9CW6smgtD.png) ### 팀원 ||||||| |:-:|:-:|:-:|:-:|:-:|:-:| ||||||| ### 시스템 구성도 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/6225c3f0a8218a9b862b17bb/Pxpv-b10ryAU1TkdiWIgV.png) ### 모델 정보 1. Base model: koRoBERTa 2. NER model: 한국해양대학교 NER 모델 (MIT License) https://github.com/kmounlp/NER ``` max_seq_length = 512 ```