metadata

base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: '[리바이스](강남점) 남성 511 슬림 스트레치 데님 팬츠(04511-4655) 29(74) 신세계백화점'
  - text: '[헤지스 남성] HZPA2D344N2 네이비 단색 면혼방 일자핏팬츠 82 (32) '
  - text: 남성 나일론 고프코어 쇼츠 그레이 (263525EY23) 회색(앤틱실버)_L (주)아이엔에프아이엑스
  - text: 멜빵바지 데님 점프수트 코디 남성 스트릿패션 M_블랙 설현닷컴
  - text: 뱅뱅 남성 23FW 라이크라 본딩 데님팬츠 3종 남성/캐주얼(하의)_38 NS홈쇼핑
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.7622648207312744
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 17 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
1.0	'씨티라이프 캠핑용우비 고급 우의 성인 다회용 eva 우비 성인 고급 EVA 우의_화이트 주식회사 씨티라이프' '투피스 비옷 우비 상하 세트 L 빛나는 오늘' '케이투 K2 경량 레인코트 KUA22913 네이비_L 롯데백화점2관'
4.0	'프리미엄 파콘 단체복 쿨카라 쿨카라 데일리 쿨프리미엄 티셔츠 파콘 쿨 티 선홍_3XL(110) 라산' '롱패딩 점퍼 주문제작 인쇄 스탭 스태프 주차관리 시큐리티 주차요원 경비복 매장 STAFF 소량 단체 L(95) 더블제이어패럴' '반팔티 남녀공용 면티 라운드 브이넥 쿨티 긴팔티 무지티 단체티 반티 교회티 티 인쇄 2_L 그룹티마켓'
15.0	'헤지스 22FW populet네이비 멜란지 면혼방 긴팔카라티셔츠 WHTS2D431N2 110 제이에스쇼핑' '베이직하우스 도톰한 순면 헤비웨이트 3팩 LVTS0103 173374 KK_085 위드홀리포' '[현대백화점][올젠] 남성 사선 조직원단 미니 와펜 맨투맨 티셔츠 6컬러 (ZOC4TR1305) 블랙/95 (주)현대백화점'
9.0	'(CC034) IS-BT03 / 1컬러 아메카지베스트조끼 그레이=FREE 페스트북' '오라 [CC034] IS-BT03 / 1컬러 아메카지베스트조끼 그레이_FREE 오라몰' '빈티지 조끼 워크웨어 카고 포켓 아메카지 루즈핏 미국식 커플 남녀 BF 미디엄 카키 스팟 촬영 배송_S 도다리'
11.0	'스파오 SPAO 배색 집업 가디건_SPCKE11W98 [15]GRAY_L[095] 카랑코롱' '남성 베이직 방모 브이넥니트 베스트AH276E-53N_3컬러_택1_KR200L/라코스테(의류) EL6(차콜그레이)_003(95) 롯데쇼핑(주)' '[지오다노] 053915 3GG 스티치 V넥 가디건 02올리브_L '
3.0	'남자남방 셔츠 청남방 캐주얼 데일리룩 IS-JK24 연청_2XL 스마트앤밸류' '(M)빈폴 셔츠 남방 단가라 아메카지 차콜08 이오' '[지오다노] 043505 코튼 린넨 셔츠 03라이트블루_XL '
8.0	'다이나핏 CHROME 크롬 β TR 슈트_Black 03(S) 제이와이글로벌' '지이크 F 다크브라운 MARLANE 마이크로 하운드투스 남성정장 FFJAX2155 308184 다크브라운_100_82 엘로이쇼핑' '파렌하이트 (23S/S) 네이비 데님라이크 투톤 솔리드 정장 FGJAA2512 네이비_95_96(38) '
7.0	'빈티지 빅사이즈 점프슈트 캐쥬얼 작업복 멜빵바지 프리사이즈_강황 링링몰' '멜빵바지 코디 남자 점프슈트 점프수트 데님 스트릿패션 XL_블랙 진아글로벌' '코오롱스포츠 남녀공용 안타티카 점프수트 JWJJX21301CHA M 미니미파크'
6.0	'[대구백화점] [트레몰로]자켓형 변형 사파리점퍼(TRNKA3M3121) 베이지 95 대구백화점' 'CODEGRAPHY 더플 후드 패딩 네이비 L 캐치데이' '다이나핏 패딩 점퍼 자켓 크롭 푸퍼 경량 양말 남성 여성 하이드 다운 리버시블 덕다운 패딩자켓 라이트베이지(E1)_95(M) 스타일메이커89'
14.0	'국내매장정품 디스커버리 프레시 벤트 우븐 반팔 트레이닝 셋업 데일리 남녀 공용 헬스 반바지 티셔츠 세트 프레시블랙_90_26 와와투유' '(탑텐밸런스)(신세계의정부점)탑텐밸런스남성 BALANCE 수퍼 스트레치 조거 팬츠 MBE5PT1206 BK_520(S) 신세계백화점' '[SET] 플루크 슬램로고 피그먼트 후드 셋업 FHT750-Z + FTP750-Z / 3color FHT750+FTP750 네이비_M 와이에이치컴퍼니(주)'
2.0	'(국내매장판/AS가능) 엄브로 파라슈트 카고 2WAY 팬츠 베이지(UO223CPT61) 085 스탠패럴' '탑텐 남성 남자 밸런스 나일론 스트레 MSC4PP1204 BK_525 지구시장11' '조거방풍바지 패딩슬랙스 패딩팬츠 남자/여자패딩바지 여자블랙3XL(66) 옐로우몰'
13.0	'프로젝트엠 남성) 캐시미어블렌드 싱글코트 EPD4CC1402 BK_110 신세계백화점' '굿라이프웍스 GLW 오버핏 울 하프 더플 코트 차콜 L 에이치닉스' '마인드브릿지 울혼방더블핸드메이드코트 MVCA7103 DM_095 주식회사 티비에이치글로벌'
16.0	'여성 간절기 천연염색 생활한복 상하의 세트 SS-HBA-F1-핑크 SS-HBA-F1-핑크_88 주식회사 샵앤' '두루마기 농민복 남녀민복 연극의상 공연한복 유관순한복 한복 블루_S(170-170) 곰곰생활' '남자 생활한복 법복 남성 여름 개량 한복 계량 빅사이즈 루즈핏 반팔 블랙_M 코람데오'
10.0	'남녀공용 빅싸이즈 테이퍼드 스판 청바지 BQI280/뱅뱅 인디고_40 롯데쇼핑(주)' 'TOFFEE 헤이즈 워시드 와이드 데님 팬츠 VINTAGE INDIGO Haze washed wide denim pants T3F-HWWDPT204VI L 더모이' '에센셜 세미와이드핏 데님 팬츠 블루 (424121LP1P) 파란색_074 신세계몰'
0.0	'타미힐피거 하프 집업 코튼 니트 DARK SABLE_2XL 뉴욕트레이딩' '[시흥점][라코스테]베이직 크루넥 풀오버 AH1988-53N 166(네이비)_004 신세계프리미엄아울렛' 'AGAINST ALL ODDS 하프 집업 카라넥 케이블 니트 차콜 HALF ZIPUP COLLAR NECK CABLE KNIT CHARCOAL A.하프 집업 카라넥 케이블 니트 차콜_L 스트릿밴드'
5.0	'앤드지 와펜 쉘파 하이넥 후리스 집업 3종택1 BDC4TCJ1002 블랙(BK)_95 롯데백화점1관' '미즈노 RB 바람막이 자켓 - 32YE250006 다크 그레이_S 롯데쇼핑(주)프리미엄아울렛 광명점' '국내발송 OUTSTANDING 아웃스탠딩 11/23 배송 REVERSIBLE LINER JACKET_OLIVE 리버서블 라이너 자켓_올리브 OS23FWJK18OL M 레몬들'
12.0	'[2만 인하]험머 남성 H1 타슬란 셋업 2종 블랙/M(95) 신세계라이브쇼핑' '펠틱스 남성 썸머 아이스 셋업 4종 95 NS홈쇼핑' '[펠틱스] 남성 썸머 아이스 셋업 4종[34239073] 110 신세계몰'

Evaluation

Metrics

Label	Metric
all	0.7623

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_ap1")
# Run inference
preds = model("멜빵바지 데님 점프수트 코디 남성 스트릿패션 M_블랙 설현닷컴")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	9.8578	23

Label	Training Sample Count
0.0	50
1.0	50
2.0	50
3.0	50
4.0	50
5.0	50
6.0	50
7.0	50
8.0	50
9.0	50
10.0	50
11.0	50
12.0	9
13.0	50
14.0	50
15.0	50
16.0	50

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (20, 20)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 40
body_learning_rate: (2e-05, 2e-05)
head_learning_rate: 2e-05
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0079	1	0.448	-
0.3937	50	0.3099	-
0.7874	100	0.1872	-
1.1811	150	0.1141	-
1.5748	200	0.0429	-
1.9685	250	0.0283	-
2.3622	300	0.0134	-
2.7559	350	0.0137	-
3.1496	400	0.0079	-
3.5433	450	0.0087	-
3.9370	500	0.0037	-
4.3307	550	0.0006	-
4.7244	600	0.0006	-
5.1181	650	0.0003	-
5.5118	700	0.0004	-
5.9055	750	0.0003	-
6.2992	800	0.0003	-
6.6929	850	0.0002	-
7.0866	900	0.0002	-
7.4803	950	0.0002	-
7.8740	1000	0.0002	-
8.2677	1050	0.0002	-
8.6614	1100	0.0002	-
9.0551	1150	0.0003	-
9.4488	1200	0.0002	-
9.8425	1250	0.0002	-
10.2362	1300	0.0002	-
10.6299	1350	0.0001	-
11.0236	1400	0.0001	-
11.4173	1450	0.0001	-
11.8110	1500	0.0001	-
12.2047	1550	0.0002	-
12.5984	1600	0.0001	-
12.9921	1650	0.0001	-
13.3858	1700	0.0001	-
13.7795	1750	0.0001	-
14.1732	1800	0.0001	-
14.5669	1850	0.0001	-
14.9606	1900	0.0001	-
15.3543	1950	0.0001	-
15.7480	2000	0.0001	-
16.1417	2050	0.0001	-
16.5354	2100	0.0001	-
16.9291	2150	0.0001	-
17.3228	2200	0.0001	-
17.7165	2250	0.0001	-
18.1102	2300	0.0001	-
18.5039	2350	0.0001	-
18.8976	2400	0.0001	-
19.2913	2450	0.0001	-
19.6850	2500	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0.dev0
Sentence Transformers: 3.1.1
Transformers: 4.46.1
PyTorch: 2.4.0+cu121
Datasets: 2.20.0
Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}