--- license: mit datasets: - nsmc - skt/kobest_v1 - jason9693/APEACH - kor_nlu - klue - KETI-AIR/korquad language: - ko pipeline_tag: text-classification --- # 아주대학교 제로샷 score model `[CLS] 입력 정보 [SEP] 지시문 [SEP] 라벨 [SEP]` 형태의 텍스트를 모델에 넣으면, 모델이 세 텍스트의 관계를 파악하고 점수를 반환합니다. 점수가 높을 수록, 라벨이 지시문을 잘 따르는 결과임을 의미합니다. 다음과 같은 사례에 사용이 가능합니다. 1. 제로샷 분류(주제 분류, 혐오 분류) 2. 데이터 필터링(~에 대한 글인가요? 예/아니오) [space demo](https://huggingface.co/spaces/iknow-lab/azou)에서 모델을 직접 사용해보세요!
base model: [klue/roberta-large](https://huggingface.co/klue/roberta-large) # 사용 예시 ``` # Load model directly from transformers import AutoTokenizer, AutoModelForSequenceClassification tokenizer = AutoTokenizer.from_pretrained("iknow-lab/azou") model = AutoModelForSequenceClassification.from_pretrained("iknow-lab/azou") def inference(instruction, input, labels): instruction = f"{input} [SEP] {instruction}" inputs = tokenizer([instruction] * len(labels), labels, truncation=True, padding=True, return_tensors="pt") scores = model(**inputs).logits.squeeze(1).tolist() output = dict(zip(labels, scores)) print(instruction, output) inference( "문장을 감성분류해주세요", "아 영화 개노잼", ["긍정적", "부정적"] ) inference( "글과 관련된 내용을 만들어주세요", "예전에는 주말마다 극장에 놀러갔는데 요새는 좀 안가는 편이에요", ["영화에 관한 글이다", "드라마에 관한 글입니다"] ) inference( "글을 읽고 시장에 미칠 영향을 판단해보세요", """인천발 KTX와 관련한 송도역 복합환승센터가 사실상 무산, 단순 철도·버스 위주 환승시설로 만들어진다. 이 때문에 인천시의 인천발 KTX 기점에 앵커시설인 복합환승센터를 통한 인근 지역 경제 활성화를 이뤄낸다는 계획의 차질이 불가피하다. 25일 시에 따르면 연수구 옥련동 104 일대 29만1천725㎡(8만8천평)에 추진 중인 2만8천62가구 규모의 송도역세권구역 도시개발사업과 연계, KTX 송도역 복합환승센터와 상업시설·업무시설 등의 조성을 추진 중이다. """, ["긍정", "부정", "중립"] ) ``` 4epoch 성능 |task|accuracy| |---|---| |nsmc|0.8742| |apeach|0.8326| |klue-ynat|0.8208| |kobest-boolq|0.896| |kobest-copa|0.709| |kobest-hellaswag|0.764| |kobest-sentineg|0.9219| |kobest-wic|0.7984| 4epoch 제로샷 성능 |task|accuracy| |---|---| |csatqa-GR|0.24| |csatqa-LI|0.2432| |csatqa-RCH|0.2571| |csatqa-RCS|0.2162| |csatqa-RCSS|0.3095| |csatqa-WR|0.0909| |aihub_complaints_topic|0.3284| |aihub_dialog_topic|0.428| |ko_relation_fields|0.403| - aihub_complaints_topic: AIHub [민원 업무 자동화 인공지능 언어 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=&topMenu=&aihubDataSe=data&dataSetSn=619) - 16개 카테고리 class 분류 - aihub_dialog_topic: AIHub [한국어 주제별 텍스트 일상대화 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=543)의 20개 주제 class 분류 - ko_relation_fields: AIHub [한국어 지식기반 관계 데이터](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=data&dataSetSn=71633) 의 13개 주제 및 분야 분류