SetFit with mini1013/master_domain
This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
- Fine-tuning a Sentence Transformer with contrastive learning.
- Training a classification head with features from the fine-tuned Sentence Transformer.
Model Details
Model Description
Model Sources
Model Labels
Label |
Examples |
5.0 |
- '에잇데이즈 셀룰라이트 괄사 크림 팔뚝 종아리 허벅지 부유방 붓기 살 제거 빼기 옵션없음 인지트레이더'
- '약손명가 여리한 패치 일시적 셀룰라이트 뱃살 복부관리 바디라인 ★앵콜특가 3Box+5매입추가증정 주식회사 약손명가 헬스케어'
- '질 전용 건조 윤활제 윤활재 부부 비건 촉촉젤 관계개선 옵션없음 다원월드'
|
13.0 |
- '스파토너 10kg 대용량입욕제 옵션없음 호른달'
- '아카로아 로즈 미니 밤 옵션없음 (주)올스프링랜드'
- '[현대백화점][사봉] 배쓰볼 파츌리라벤더바닐라 150g [00001] 단일상품 (주)현대홈쇼핑'
|
12.0 |
- '피에이치포 팬톡 파우더 올리브영 여성청결제 밸런스톡 뿌리는 Y존 이너케어 질 유래 유산균 뿌리는 질유산균파우더 팬톡6.6g(2개월분) 지비비 주식회사 (GBB CO. LTD)'
- '비오텀 인팀 워시폼 여성청결제 (거품타입) 250ml 크랜베리 인팀 워시 폼 250ml 주식회사바이유럽'
- '이너수 질세정기 2개입X2박스(4개입) 질내 보습 삽입형 의료기기 질세정제 주사기타입 여성청결제 옵션없음 알리코제약(주)'
|
8.0 |
- '씨큐라롬 젤 옵션없음 (주)에코앤네이쳐'
- '넛세린 시즌3 슈퍼 넛 너리싱 밤 100ml 촉촉함(수분공급), 부드러운 발림 저자극, 각질케어, 윤기부여, 흡수력, 어린이겸용 옵션없음 나뭉'
- '온열 스포츠 박찬호 크림_콜라보에디션 신태용 리커버리 크림 플러스 500ml+60ml(2mlx30ea) 옵션없음 주식회사 동지'
|
11.0 |
- '도테라 자몽15ml 도테라오일 doterra 옵션없음 베르데몰'
- '나우푸드 유기농 오렌지 에센셜 오일 1온즈 옵션없음 CONNECTLAB INC'
- '도테라 오레가노터치 10ml 도테라오일 롤온 옵션없음 베르데몰'
|
1.0 |
- '괌여행 사이판선물 괌기념품 민감성피부 플러스 노니비누 9+1세트 건성 복합성 옵션없음 킹피셔스노니'
- '도브 센서티브바 미국 106g 14개입 옵션없음 옐로우브릭로드'
- '웰바스 아이스크림솝 270g 옵션없음 (주)미르코스'
|
6.0 |
- '[눅스] 윌 프로디쥬스 멀티 네롤리 오일 100ml 옵션없음 주식회사케이엔유'
- '[아베다] 쿨링 밸런싱 오일 50ml~한글택X 옵션없음 쉬즈 스토리'
- '도테라 코코넛오일 옵션없음 공감브레인 상담센터'
|
14.0 |
- '셀프왁싱 대용량 제모하드왁스 크리스탈500g 옵션없음 주식회사 모컴퍼니'
- '이탈왁스 하드 너바나 아로마틱스파 라벤더1kg 옵션없음 파인뷰티'
- '생식기제모크림 엉덩이 가슴털 항문제모크림 옵션없음 다담꼬'
|
0.0 |
- '크리스탈 미네랄 데오드란트 롤온 무향 66ml 옵션없음 비래유통'
- '[공식몰] 크리스탈 데오드란트 120g 무향 대용량 스틱 2EA 옵션없음 주식회사 미스코스'
- 'GBH 지비에이치 센티드 데오스틱 3종 택1 24g NEROLI MUSK 주식회사 지비에이치'
|
7.0 |
- '베르뷔 고보습 대용량 퍼퓸 바디로션 & 워시 베르뷔'
- '[기획] 베스트셀러 3종 그린로즈 라지 세트 옵션없음 (주)비엔에프통상'
- 'nb도브여행용3종-B타입 1box50입 옵션없음 물빛나래상회'
|
3.0 |
- 'W5250F5U7 134ml 그린 샤워코롱 옵션없음 성진몰'
- '더프트앤도프트 바디 퍼퓸 미스트 80ml 베이비소피 주식회사 제너럴브랜즈'
- '조러브스 조 바이 조 러브스 배스 코롱 200ml 옵션없음 포비티엘'
|
15.0 |
- '블루크로스 캘러스 32oz 946ml 발뒷꿈치 각질제거 각질연화 굳은살제거 32oz_비닐발커버 50매 백억언니'
- '히말라야 풋 케어 크림 75ml 옵션없음 스루치로 유한책임회사'
- '[1+1] 바렌 시어버터 슬리핑 뒤꿈치 보습 발각질 풋케어 힐 패치 1개 (10개입) (주)마르스랩스'
|
4.0 |
- '아몬드 샤워 스크럽 200ml 옵션없음 플래너'
- '지오마 이몰리언트 바디스크럽 600g 1개 600g × 1개 600g x 1개 케이컴퍼니'
- '엄마의목욕탕레시피 바디필링패드 1매입 스트롱 주워 담다'
|
2.0 |
- '쿤달 허니 앤 마카다미아 모이스처 퓨어 바디로션 베이비 파우더 500ml 옵션없음 굿우리'
- '암웨이 GH 너리쉬 400ml (23년 new) 최신정품 옵션없음 포유어뷰티'
- 'LOCCITANE 록시땅 [버베나 포켓솝 정품 ]시트러스 버베나 프레쉬 밀크 250ml 15LC250VA23 259557 옵션없음 냥냥홀릭'
|
9.0 |
- '바이오가 등드름 바디워시 베타인살리실레이트 옵션없음 카프리'
- 'x 2개 바디워시 910g 베이비파우더 해피바스 1WDC1FFF7 옵션없음 플러스몰'
- '더바디샵 모링가 샤워젤 750ml(신형) 1개 옵션없음 디제이커머스(DJ커머스)'
|
16.0 |
- '얼투아 PERFUME HAND CREAM WINTER ROSE 옵션없음 현대스타일'
- '아이깨끗해 프리미엄 클린 비건 폼 핸드솝 피오니향 450ml 1개 옵션없음 둘레푸드'
- 'Oz 아이깨끗해 순2종세트 옵션없음 온집안(onziban)'
|
10.0 |
- '파우더/피부파우더/분칠/아기엉덩이 아기살접힌데 존슨즈 콘스타치 옵션없음 진소란총각네'
- '영국 우즈오브윈저 화이트 자스민 바디 파우더 100g / Woods of windsor 옵션없음 Hong Joo Ra'
- '파우더200g/ 존슨즈 땀띠 분칠 아기 엉덩이 콘스타치 존슨즈 콘스타치 파우더200g 후니후니003'
|
Evaluation
Metrics
Label |
Accuracy |
all |
0.7189 |
Uses
Direct Use for Inference
First install the SetFit library:
pip install setfit
Then you can load this model and run inference.
from setfit import SetFitModel
model = SetFitModel.from_pretrained("mini1013/master_cate_bt3_test")
preds = model("아로마티카 퓨어 앤 소프트 여성청결제 170ml (폼타입) 옵션없음 포사도")
Training Details
Training Set Metrics
Training set |
Min |
Median |
Max |
Word count |
3 |
9.3333 |
20 |
Label |
Training Sample Count |
0.0 |
22 |
1.0 |
20 |
2.0 |
20 |
3.0 |
12 |
4.0 |
21 |
5.0 |
18 |
6.0 |
23 |
7.0 |
15 |
8.0 |
20 |
9.0 |
20 |
10.0 |
11 |
11.0 |
15 |
12.0 |
20 |
13.0 |
23 |
14.0 |
21 |
15.0 |
22 |
16.0 |
21 |
Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (50, 50)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 60
- body_learning_rate: (2e-05, 1e-05)
- head_learning_rate: 0.01
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- l2_weight: 0.01
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
Training Results
Epoch |
Step |
Training Loss |
Validation Loss |
0.0263 |
1 |
0.5057 |
- |
1.3158 |
50 |
0.423 |
- |
2.6316 |
100 |
0.1568 |
- |
3.9474 |
150 |
0.067 |
- |
5.2632 |
200 |
0.0479 |
- |
6.5789 |
250 |
0.0324 |
- |
7.8947 |
300 |
0.0196 |
- |
9.2105 |
350 |
0.0138 |
- |
10.5263 |
400 |
0.0111 |
- |
11.8421 |
450 |
0.0051 |
- |
13.1579 |
500 |
0.0041 |
- |
14.4737 |
550 |
0.0043 |
- |
15.7895 |
600 |
0.0026 |
- |
17.1053 |
650 |
0.0005 |
- |
18.4211 |
700 |
0.0003 |
- |
19.7368 |
750 |
0.0002 |
- |
21.0526 |
800 |
0.0002 |
- |
22.3684 |
850 |
0.0002 |
- |
23.6842 |
900 |
0.0002 |
- |
25.0 |
950 |
0.0002 |
- |
26.3158 |
1000 |
0.0001 |
- |
27.6316 |
1050 |
0.0001 |
- |
28.9474 |
1100 |
0.0001 |
- |
30.2632 |
1150 |
0.0001 |
- |
31.5789 |
1200 |
0.0001 |
- |
32.8947 |
1250 |
0.0001 |
- |
34.2105 |
1300 |
0.0001 |
- |
35.5263 |
1350 |
0.0001 |
- |
36.8421 |
1400 |
0.0001 |
- |
38.1579 |
1450 |
0.0001 |
- |
39.4737 |
1500 |
0.0001 |
- |
40.7895 |
1550 |
0.0001 |
- |
42.1053 |
1600 |
0.0001 |
- |
43.4211 |
1650 |
0.0001 |
- |
44.7368 |
1700 |
0.0001 |
- |
46.0526 |
1750 |
0.0001 |
- |
47.3684 |
1800 |
0.0001 |
- |
48.6842 |
1850 |
0.0001 |
- |
50.0 |
1900 |
0.0001 |
- |
Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0
- Sentence Transformers: 3.3.1
- Transformers: 4.44.2
- PyTorch: 2.2.0a0+81ea7a4
- Datasets: 3.2.0
- Tokenizers: 0.19.1
Citation
BibTeX
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}