File size: 18,447 Bytes
17db187 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 |
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 빌트록스 85mm F1.8 STM AF II 소니 풀프레임 FE-mount 주식회사 에스에이치몰
- text: 185CM 카메라 스마트폰 삼각대 SEL-ML185K 주식회사 셀루미
- text: 켄코 리얼프로 REALPRO UV 필터 43mm(포켓융+렌즈클리너)/JW (주)제이더블피앤엘
- text: 후지필름 XC35mm F2 렌즈 정품 입고완료 구매가능 주식회사 제이에스헤럴드나인
- text: 캐논 RF 100-500mm F4.5 7.1 L IS USM 망원렌즈 VSGO DKL-20 오.케이.굳 주식회사
inference: true
model-index:
- name: SetFit with mini1013/master_domain
results:
- task:
type: text-classification
name: Text Classification
dataset:
name: Unknown
type: unknown
split: test
metrics:
- type: metric
value: 0.8190048035472349
name: Metric
---
# SetFit with mini1013/master_domain
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.
## Model Details
### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 19 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
### Model Labels
| Label | Examples |
|:------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | <ul><li>'인스탁스 미니에보 Evo 액정보호필름 주식회사 제이에스헤럴드나인'</li><li>'DJI 오즈모 액션3 올레포빅 고광택 액정 보호필름 2세트 주식회사 좀비베리어'</li><li>'소니 알파 강화유리 액정보호필름 A7C 미러리스 전용 주식회사 리디브'</li></ul> |
| 18 | <ul><li>'[후지필름]일회용카메라 심플에이스 / /필름감성 에프컴퍼니'</li><li>'KODAK H35 하프 필름카메라 토이카메라 - Sage (주)디지안'</li><li>'HARMAN XP2 Super 흑백 일회용카메라 (ISO400-27컷) 지오엔스토어'</li></ul> |
| 5 | <ul><li>'주)가게 고프로 정품 쇼티 Gopro Shorty 미니 셀카봉 삼각대 주식회사 가게'</li><li>'스몰리그 SR3232 후지 GFX 100S용 엘브라켓 주식회사 티에스아이시스템'</li><li>'레오포토 Mr.Y 미스터와이 LY-224C + LH-25R 카본 삼각대 옐로우 (주)디카몰'</li></ul> |
| 4 | <ul><li>'소니 풀프레임 미러리스 카메라 알파 ILCE - 7M4 바디 / A7 IV / A7M4 (주)컴퓨존'</li><li>'후지필름 X-T30 II XF18-55mm Kit 공식대리점 X-T30II 18-55 블랙 (당일배송) 주식회사 이로운컴퍼니'</li><li>'캐논정품 / EOS M200 렌즈미포함 / 남대문 현찬디지탈 블랙 현찬디지탈'</li></ul> |
| 14 | <ul><li>'씨에스타 가죽스트랩 RF12 (8Color) 다크 브라운 더35미리(the35mm)'</li><li>'K&F CONCEPT KF13.115V1 블랙 이중버클 퀵릴리즈 넥스트랩 자동차 안전벨트 소재 그레이 (KF13.115) (주)아이라이징'</li><li>'[ARTISAN&ARTIST] ACAM-25 OLIVE (주)컴퓨존'</li></ul> |
| 8 | <ul><li>'인스탁스 미니필름 마카롱1팩(10장) 캐릭터필름 /폴라로이드필름 인스탁스 미니필름 마카롱1팩(10장) 필름스튜디오'</li><li>'후지필름 인스탁스 미니11 미니12 미니에보 전용 미니필름 1P(10매) 선물set /오늘주문 주식회사 제이에스헤럴드나인'</li><li>'인스탁스 캐릭터 스퀘어필름(모노크롬)+포토라인/폴라로이드 SQ1 SQ6 10 20 40 쉐어 스퀘어필름 모노크롬 1팩(10장)+포토라인 글로리스(주)'</li></ul> |
| 0 | <ul><li>'니콘 D5500 바디만 정품 샤인프라자'</li><li>'캐논 EOS 200D II BODY (블랙) DSLR카메라 오.케이.굳 주식회사'</li><li>'캐논정품 / EOS 5D Mark IV / 렌즈미포함 / 남대문 현찬디지탈 현찬디지탈'</li></ul> |
| 6 | <ul><li>'DJI 액션3 스탠더드 콤보 (액션 카메라 4K 초광각 FOV 휴대성 웨어러블 고속충전) 대원씨티에스(주)'</li><li>'포팩트 4FACT NT20 주식회사 렉스쿨컴퍼니'</li><li>'[ ] 트랜센드 바디캠 DrivePro Body 30 ( 보안캠 경찰 소방관 안전 산업재해 ) 30000 mAh 대용량 보조배터리 (주)유아이커머스'</li></ul> |
| 12 | <ul><li>'로우프로 프로택틱 백팩 350 AW II (친환경소재/새로운라인) (주)디에스엘알스토어'</li><li>'Billingham Hadley Small Pro / 네이비쵸코 / 빌링햄 / 카메라백 / 세기정품 엠더블유 플랫폼(MW Platform)'</li><li>'로우프로 패스트팩 프로 250 AW III 백팩 (그레이) 지오엔스토어'</li></ul> |
| 11 | <ul><li>'DJI Mic 2 무선 마이크 (2 TX + 1 RX + 충전 케이스) (FCC) 대원씨티에스(주)'</li><li>'열림에이브이 국내조립 포니콘루페(블랙/그린/노랑) 10X/ 니콘루페/필름색판정/ 곤충식물 관찰자연확대경/사각루페/ 숲관찰/ 숲체험/ 환경체험 어린이선물 유치원교구 수입유리렌즈_포니콘블랙루페 열림AV'</li><li>'for 니콘루페 10X 휴대용 미니 돋보기 필름확대 목걸이타입 어린이집 유치원 교보재 포커스루페 포커스엠제이'</li></ul> |
| 2 | <ul><li>'겐코 AIR UV 52mm 슬림 렌즈 필터 UV코팅 주식회사 앤엑스라인'</li><li>'호야 Sparkle 52mm 스파클 6X 크로스 필터 포인트광원 포토하우스'</li><li>'호야 WIDE CPL필터 52mm 일출포토테크닉'</li></ul> |
| 15 | <ul><li>'HDR-CX405 정품 미니핸드캠 FULL HD캠코더 와이지스토어(주) (YG store Co., Ltd)'</li><li>'파나소닉 AG-CX10 4K HD라이브스트리밍/캠코더 주식회사 센스포켓(sens pocket)'</li><li>'파나소닉 프로페셔널 캠코더 HC-X1500 /4K/UHD/60FPS/광학24배/방송용 주식회사 무한미디어'</li></ul> |
| 16 | <ul><li>'[Elgato] Key Light 엘가토 키 라이트 제니스'</li><li>'레이저코리아 Ring light 링 라이트 YT 주식회사 옐로우트리'</li><li>'고독스 LED 조명 소형 휴대용 색 온도 조절 데스크탑 탁상용 LC30Bi 주식회사 센스포켓(sens pocket)'</li></ul> |
| 3 | <ul><li>'트랜센드 SDHC Class10 600X UHS-1 8GB (주)유아이커머스'</li><li>'삼성전자 삼성 공식인증 마이크로 SD카드 PRO ENDURANCE 32GB MB-MJ32KA/APC 메모리카드 보관함케이스 주식회사 트라오'</li><li>'(트랜센드) CF 133X 2GB 정품 밀알시스템'</li></ul> |
| 7 | <ul><li>'(리안)파워샷 G7X Mark II/정품 주식회사 리안'</li><li>'리코정품/ GR IIIx / GR3x / 단품 /남대문 현찬디지탈 현찬디지탈'</li><li>'리코GR3 스트리트 에디션 RICOH GR III Street Edition 어썸팩토리(awesome factory)'</li></ul> |
| 17 | <ul><li>'[개수제한 없음] 코닥 컬러플러스 200/36 2024-2025 kodak colorplus 200 컬러네거티브 36장 컬러필름 입문용필름 저스트픽쳐(Just picture)'</li><li>'코닥필름 포트라 PORTRA 160 135-36 1롤 프로용 네가티브필름 코닥 포트라 160 135-36 [1롤] 필름스튜디오'</li><li>'10롤1세트-후지 컬러 네가티브 C200 후속 필름 200/36(수동필름/SO200/입문용)-24년11월 이터너블 (eternovel)'</li></ul> |
| 9 | <ul><li>'파나소닉 에네루프 BQ-CC55 신형 급속충전기 AA/AAA 배터리케이스 제공 파나소닉 신형충전기 BQ-CC55 미래테크'</li><li>'캐논 LP-E8 호환배터리 EOS 550D 전용배터리 주식회사 에스에이치몰'</li><li>'후지 NP-45/45A 호환 배터리 FinePix JX200 J40 주식회사 위너스클럽'</li></ul> |
| 10 | <ul><li>'카리미/9723TC-OTG 블랙박스 멀티 SD카드 리더기 넷트루'</li><li>'USB3.0 올인원 카드리더기 NEXT-9703U3 엠스타샵'</li><li>'엑토 C타입 USB 3.2 Gen1 OTG 멀티 카드리더기 CRD-44 (주)신진교역'</li></ul> |
| 13 | <ul><li>'캐논 EF-S 18-135mm F3.5-5.6 IS USM / DN 디지탈나라'</li><li>'후지필름 GF110mm F2 R LM WR 온라인대리점 구매가능 주식회사 제이에스헤럴드나인'</li><li>'탐론 18-200 F3.5-6.3 Di II VC B018 캐논용 주식회사 엔터커머스'</li></ul> |
## Evaluation
### Metrics
| Label | Metric |
|:--------|:-------|
| **all** | 0.8190 |
## Uses
### Direct Use for Inference
First install the SetFit library:
```bash
pip install setfit
```
Then you can load this model and run inference.
```python
from setfit import SetFitModel
# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el20")
# Run inference
preds = model("185CM 카메라 스마트폰 삼각대 SEL-ML185K 주식회사 셀루미")
```
<!--
### Downstream Use
*List how someone could finetune this model on their own dataset.*
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:-------|:----|
| Word count | 3 | 9.9389 | 25 |
| Label | Training Sample Count |
|:------|:----------------------|
| 0 | 50 |
| 1 | 50 |
| 2 | 50 |
| 3 | 50 |
| 4 | 50 |
| 5 | 50 |
| 6 | 50 |
| 7 | 50 |
| 8 | 50 |
| 9 | 50 |
| 10 | 50 |
| 11 | 50 |
| 12 | 50 |
| 13 | 50 |
| 14 | 50 |
| 15 | 50 |
| 16 | 50 |
| 17 | 50 |
| 18 | 50 |
### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
### Training Results
| Epoch | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0067 | 1 | 0.4972 | - |
| 0.3356 | 50 | 0.3162 | - |
| 0.6711 | 100 | 0.178 | - |
| 1.0067 | 150 | 0.1148 | - |
| 1.3423 | 200 | 0.0596 | - |
| 1.6779 | 250 | 0.0503 | - |
| 2.0134 | 300 | 0.0288 | - |
| 2.3490 | 350 | 0.03 | - |
| 2.6846 | 400 | 0.0227 | - |
| 3.0201 | 450 | 0.0219 | - |
| 3.3557 | 500 | 0.022 | - |
| 3.6913 | 550 | 0.0127 | - |
| 4.0268 | 600 | 0.007 | - |
| 4.3624 | 650 | 0.0098 | - |
| 4.6980 | 700 | 0.0037 | - |
| 5.0336 | 750 | 0.0044 | - |
| 5.3691 | 800 | 0.0041 | - |
| 5.7047 | 850 | 0.0003 | - |
| 6.0403 | 900 | 0.0022 | - |
| 6.3758 | 950 | 0.0002 | - |
| 6.7114 | 1000 | 0.0053 | - |
| 7.0470 | 1050 | 0.0006 | - |
| 7.3826 | 1100 | 0.0006 | - |
| 7.7181 | 1150 | 0.0003 | - |
| 8.0537 | 1200 | 0.0002 | - |
| 8.3893 | 1250 | 0.0002 | - |
| 8.7248 | 1300 | 0.0002 | - |
| 9.0604 | 1350 | 0.0002 | - |
| 9.3960 | 1400 | 0.0002 | - |
| 9.7315 | 1450 | 0.0001 | - |
| 10.0671 | 1500 | 0.0002 | - |
| 10.4027 | 1550 | 0.0002 | - |
| 10.7383 | 1600 | 0.0001 | - |
| 11.0738 | 1650 | 0.0002 | - |
| 11.4094 | 1700 | 0.0001 | - |
| 11.7450 | 1750 | 0.0001 | - |
| 12.0805 | 1800 | 0.0001 | - |
| 12.4161 | 1850 | 0.0001 | - |
| 12.7517 | 1900 | 0.0001 | - |
| 13.0872 | 1950 | 0.0001 | - |
| 13.4228 | 2000 | 0.0001 | - |
| 13.7584 | 2050 | 0.0001 | - |
| 14.0940 | 2100 | 0.0001 | - |
| 14.4295 | 2150 | 0.0001 | - |
| 14.7651 | 2200 | 0.0001 | - |
| 15.1007 | 2250 | 0.0001 | - |
| 15.4362 | 2300 | 0.0001 | - |
| 15.7718 | 2350 | 0.0001 | - |
| 16.1074 | 2400 | 0.0001 | - |
| 16.4430 | 2450 | 0.0001 | - |
| 16.7785 | 2500 | 0.0001 | - |
| 17.1141 | 2550 | 0.0001 | - |
| 17.4497 | 2600 | 0.0001 | - |
| 17.7852 | 2650 | 0.0001 | - |
| 18.1208 | 2700 | 0.0001 | - |
| 18.4564 | 2750 | 0.0001 | - |
| 18.7919 | 2800 | 0.0001 | - |
| 19.1275 | 2850 | 0.0001 | - |
| 19.4631 | 2900 | 0.0001 | - |
| 19.7987 | 2950 | 0.0001 | - |
### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
## Citation
### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |