SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
12
  • '[BOSE] 보스 옴니 주얼 실링(천장) 브라켓 (서라운드 스피커 700 전용) 블랙 세트 코오롱모빌리티그룹 주식회사'
  • '마샬 엠버튼2 블루투스 캠핑 스피커 크림 휴대용 연동가능 엠버튼II 앰버튼 일대의 고배급 삼림녹은 한 야드씩이다. 두즈 몰'
  • 'GENPRO SS-2스피커스탠드 공연 무대 버스킹용 1개가격 제이에스사운드'
8
  • '카날스BKM-150 컴비네이션 테이블타입 미니앰프 포도나무'
  • 'Denon AVR-X250BT/수입正品/5.1CH AV 리시버 주누 트레이드 (JUNU TRADE)'
  • '카날스 KQ-800W 4채널 800W 파워앰프 교회 노래방 장 앰프 사운드테크'
15
  • '웨이코스 씽크웨이 TONE BOB SHOCK 8D 주식회사 브라보세컨즈'
  • '[스페셜케이스]젠하이저 IE 100 pro Wired 모니터링 인이어 이어폰 레드(RED) 찬양랜드'
  • '[Sennehiser] 젠하이저 IE200 모니터링 이어폰 인이어 온더그랩'
21
  • 'Britz 브리츠인터내셔널 BZ-T3400 AV SoundBar 주식회사 동행하기'
  • '[Britz] 브리츠 BZ-T2230S AV Soundbar 블루투스 사운드바 시스템 더그랩사운드'
  • '드비알레 디온(DEVIALET DIONE) 사운드바 (주)울타리컴퍼니'
17
  • 'Britz 브리츠인터내셔널 BZ-C3900RT 주식회사 레오솔루션'
  • 'Britz 브리츠인터내셔널 BZ-BBX2 주식회사 에스씨엠인포텍'
  • '코비 냥냥이 댕댕이 블루투스 CD플레이어 BTCD7 FM라디오 어학용 스마트폰 음악재생 냥냥이 (주)디피이'
20
  • 'ULTRASONE 울트라손 헤드폰 Signature Pure 국내정품 1년보증AS 윤테크(YOON TECH)'
  • '터틀비치 아틀라스 에어 Atlas Air 무선 게이밍 헤드셋 (주)베스트파이브'
  • '재고당일발 노이만 NDH30 Black Edition Neuman NDH 30 블랙에디션 한정판 오픈형 모니터링용 정품보증서 NDH30 블랙에디션한정판:당일발송 신화'
13
  • 'NMA-LB433 스피커 관절형 벽걸이 거치대(2.6kg) 서준전자'
  • 'Britz 브리츠인터내셔널 BZ-T7780 (주)빈컴'
  • '루악오디오 R3s ruarkaudio 국내정품 Rich Walnut (월넛) 라이프스타일샵'
19
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
  • '블루투스앰프 매장용앰프 업소용 카페 매장 2채널 200W 스피커앰프 미니앰프 '
10
  • '[재고보유/당일출고] 한글설명서 뮤직랜드 Behringer XR18 베링거18 xr-18 디지털믹서 뮤직랜드'
  • '베링거 DI100 1채널 액티브 다이렉트 박스 DI 주식회사 뮤존(MUZON)'
  • '베링거 DI-100 다이렉트박스, DIBOX 토포스사운드'
6
  • 'CDP-1000 ENW USB 1CD PLAYER 클럽/스포츠센터/매장 CDA1000USB CDA1000USB옴니트로닉 비비케이사운드'
  • '-네이버회원 추가쿠폰-빈센트 CD-S7 DAC 진공관 하이브리드 CD플레이어 [VINCENT] 0 주식회사 탑제이앤에이취'
  • 'DENON (데논) DCD-A110 / 110주년 기념 CD 플레이어 무진AV상사'
18
  • '[CROSLEY 크로슬리] Musician 뮤지션 엔틱 감성 올인원 CD 테이프 블루투스 턴테이블 CR704B ITDictionary'
  • '휴라이즈 HR-TS100 LP 텐테이블 주식회사 씨알텍'
  • '디앤비인터내셔널 휴라이즈 HR-TS100 (주)아토닉스'
1
  • 'iFi Audio ZEN DAC Signature V2 아이파이 고해상도 데스크탑 DAC 젠덱 시그니처 서울악기'
  • 'iFi audio Go blu 소형 HD블루투스 DAC 앰프 윌텍미디어'
  • 'TOPPING DX5 Lite 블루투스DAC 토핑 DX5 헤드폰앰프 블랙 (주)제이엘더블유'
14
  • '마이다스 M32R LIVE/마이다스 총판 공식 인증 대리점/마이다스 정품[재고 보유/당일 출고] 한솔전자'
  • 'Solid State Logic SSL 2+ (연말 연초 세일 2월29일까지) (주)국제미디'
  • 'Pioneer DJ DDJ-FLX4 파이오니아 디제이 2채널 디제이 컨트롤러 (주)뮤직메트로'
0
  • '데논(DENON) DCD-600NE CD플레이어(실버) (주)음자리'
  • '댕댕이 포터블 탁상용 블루투스 어학 공부 아기 CD플레이어 BTCD10 냥냥이 (주)아임커머스'
  • 'ENZER(엔저) EN-CD1BT CD플레이어 USB 블루투스 원목디자인 월넛 (재고보유) 원형사운드'
7
  • 'Britz 브리츠인터내셔널 BZ-R120 (블랙) 휴대용 미니 효도라디오 (주)아이텐츠'
  • 'Britz 브리츠인터내셔널 BZ-LV980 블루투스 라디오 MP3 스피커 블랙 (주)가이드컴'
  • 'Britz LED 대나무 FM 라디오 알람 온도 시계 BZ-E2R 아이티조이'
2
  • '에픽 E100B 블루투스MP3플레이어 / FM라디오 내장스피커 동영상 TF32GB확장 1. 초콜렛(4GB) 에픽'
  • '아스텔앤컨 Astell&kern KANN ULTRA DAP 주식회사 그린파워테크'
  • 'w Britz BZ-MP4580BL /MP3/녹음기/라디오/블루투스 (주)원영씨앤씨'
11
  • '[Apple 에어팟] 애플 에어팟 유선 충전 2세대 (국내 정식 발매 제품) MV7N2KH/A Apple AirPods 2nd Gen (Korean Ver.) 슈박스 (Shoe Box)'
  • '샥즈 오픈런 프로 S810 블랙 골전도 블루투스 무선 이어폰 Shokz 수영 등산 운동 스포츠 액티비티 아웃도어 (국내정품, 2년 보증) 1. 블랙 클레디오'
  • '포칼 FOCAL Bathys/수입正品/노이즈 캔슬링/블루투스/하이파이 주누 트레이드 (JUNU TRADE)'
5
  • '케이뮤직박스 서영엔터테인먼트 AV-1000 이동식노래방 휴대용 캠핑 충전용 야외용 우림미디어'
  • '미가엘 E9S 찬송가 반주기 리모콘 마이크포함 복음성가 성경낭독 지에스음향'
  • '미가엘 E9S E-9S 찬양반주기 찬양연주기 이니트(INNIT)'
9
  • '[KANALS]카날스 MJ-117 MJ117 원터치 T자형 마이크스탠드 공연용녹음용보컬용 김청애'
  • 'LEWITT LCT440 PURE 르윗 프로 콘덴서 마이크 보컬 홈레코딩 공연 방송 녹음 멘토나무'
  • '스토리하우스 네코 NK-UA600 2021년형 번슬리'
3
  • '아이리버 아스텔앤컨 AK-RM01 블루투스 리모컨 다손아이앤씨'
  • 'COMS) 3.7V 리튬이온 배터리(BL-5B) 라디오/UB714 비스티앤씨'
  • '미테르 케이스 아스텔앤컨 HB1 커버 MITER Astell&Kern AK HB1 case (착탈식 목걸이 줄 포함 팩키지) 네이비 (이태리PU인조합성가죽) 굿씨드인터내셔널'
16
  • '로마네 Romane 365 포켓 에어팟 파우치 그라미상점'
  • '에어팟 프로 실리콘 케이스 키링 1세대 2세대 공용 에어팟프로(1/2세대공용)실리콘케이스(그린) 아이킨'
  • '플래나 에어플레인 티켓 시리즈 에어팟 프로 커스텀 TPU 투명 케이스 에어팟 1/2세대_1. 서울 주식회사 플랜지'
4
  • '토마토 5인치 PMP익스트림터치 8GB+전용충전기 5인치 익스트림터치16G 주식회사 스피티'
  • '코원 스터디프로 V7 32GB+펠트파우치 /MP3/PMP 주식회사 스피티'
  • '[AS 1년보증+코원 온라인 공식판매처+재고확보] 코원 스터디프로 V7 32GB+펠트파우치/MP3/PMP [코원]스터디프로V7[32GB][화이트] (주)엠피나비'

Evaluation

Metrics

Label Metric
all 0.7123

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el14")
# Run inference
preds = model("브리츠 P510GX 유선이어폰 음악+통화 언더이어 오픈형  (주)엠글로벌스")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 3 9.4791 33
Label Training Sample Count
0 50
1 50
2 50
3 12
4 4
5 50
6 50
7 50
8 50
9 50
10 50
11 50
12 50
13 50
14 50
15 50
16 50
17 50
18 50
19 13
20 50
21 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0065 1 0.497 -
0.3268 50 0.3791 -
0.6536 100 0.2221 -
0.9804 150 0.1258 -
1.3072 200 0.0648 -
1.6340 250 0.0513 -
1.9608 300 0.0383 -
2.2876 350 0.0297 -
2.6144 400 0.0308 -
2.9412 450 0.0208 -
3.2680 500 0.0132 -
3.5948 550 0.0188 -
3.9216 600 0.0196 -
4.2484 650 0.0158 -
4.5752 700 0.0061 -
4.9020 750 0.009 -
5.2288 800 0.0107 -
5.5556 850 0.0048 -
5.8824 900 0.0024 -
6.2092 950 0.0077 -
6.5359 1000 0.0023 -
6.8627 1050 0.0077 -
7.1895 1100 0.006 -
7.5163 1150 0.003 -
7.8431 1200 0.0046 -
8.1699 1250 0.0062 -
8.4967 1300 0.003 -
8.8235 1350 0.0022 -
9.1503 1400 0.0004 -
9.4771 1450 0.0003 -
9.8039 1500 0.0003 -
10.1307 1550 0.0022 -
10.4575 1600 0.0006 -
10.7843 1650 0.0002 -
11.1111 1700 0.0002 -
11.4379 1750 0.0002 -
11.7647 1800 0.0029 -
12.0915 1850 0.0002 -
12.4183 1900 0.0001 -
12.7451 1950 0.0001 -
13.0719 2000 0.0001 -
13.3987 2050 0.0001 -
13.7255 2100 0.0001 -
14.0523 2150 0.0002 -
14.3791 2200 0.0001 -
14.7059 2250 0.0001 -
15.0327 2300 0.0001 -
15.3595 2350 0.0001 -
15.6863 2400 0.0001 -
16.0131 2450 0.0002 -
16.3399 2500 0.0001 -
16.6667 2550 0.002 -
16.9935 2600 0.0001 -
17.3203 2650 0.002 -
17.6471 2700 0.0001 -
17.9739 2750 0.0001 -
18.3007 2800 0.0001 -
18.6275 2850 0.0001 -
18.9542 2900 0.0021 -
19.2810 2950 0.0001 -
19.6078 3000 0.0001 -
19.9346 3050 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
719
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_el14

Base model

klue/roberta-base
Finetuned
(132)
this model

Evaluation results