SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("Mykes/med-MiniLM-L12-v2")
# Run inference
sentences = [
    'Запрос: \n\nУ меня наблюдаются  нерегулярные месячные.  Какие методы диагностики и лечения  этих проблем существуют? \n',
    'стоимость приема от: 4900 руб (высокая стоимость приема); стаж: 8 лет; специальность: гинеколог; пациенты: взрослые; тип приёма: в клинике; клиника: клинико-диагностический центр медси на солянке; красносельская, лубянка, китай-город, цветной бульвар; ; специализация: ведение беременности подбор метода контрацепции, планирование и подготовка к беременности, в том числе введение и извлечение любых видов внутриматочной спирали заболеваний шейки матки кольпоскопия, лечение шейки матки с применением радиоволновых методов сургитрон лечение патологии эндометрия, биопсия шейки матки, папиллом радиоволновой метод выполнение магнитотерапии влагалища при заболеваниях женских половых органов, аспирационная биопсия эндометрия пайпельбиопсия гистероскопия с раздельным диагностическим выскабливанием удаление полипов эндометрия',
    'высокая стоимость приема; стаж: 21 год; тип приёма: в клинике; клиника: gms clinic на смоленской; смоленская, киевская; венеролог, дерматолог, дерматовенеролог; специализация: лишаи различных типов псориаз дерматит аллергический, контактный, нейродермит акне угрей экзема розацеа себорея вирусных заболеваний кожи паппиломы, герпес микозов грибковых заболеваний кожи, атопический, бородавки',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 1,500 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 15 tokens
    • mean: 38.47 tokens
    • max: 128 tokens
    • min: 63 tokens
    • mean: 118.31 tokens
    • max: 128 tokens
  • Samples:
    anchor positive
    Какие препараты назначают при эндометриозе, и как они влияют на мое состояние?
    стоимость приема от: 5000 руб (высокая стоимость приема); стаж: 46 лет; квалификация: врач высшей категории; пациенты: взрослые; тип приёма: в клинике; клиника: многопрофильная клиника союз; электрозаводская, сокольники; гинеколог, гинеколог-эндокринолог; специализация: амбулаторная гинекология
    У моего ребенка часто возникают аллергические реакции, в том числе на укусы насекомых и некоторые продукты. Какие препараты можно использовать для лечения и профилактики аллергии у детей, и как определить, какая аллергия является наиболее серьезной?

    стоимость приема от: 9000 руб (высокая стоимость приема); стаж: 41 год; звание: профессор; учёная степень: доктор медицинских наук; пациенты: дети; тип приёма: в клинике; клиника: медгород чистые пруды; тургеневская, сретенский бульвар, чистые пруды; аллерголог, иммунолог; специализация: так и с отклонениями здоровья, бронхиальная астма аллергический ринит насморк аллергический конъюнктивит крапивница в тч острая и хроническая атопический, инсектная аллергия на укусы насекомых вич и иммунодефицитные состояния цитомегаловирусные инфекции герпесвирусные инфекции дисфункции иммунной системы частые простудные заболевания ведение детей как здоровых, контактный дерматит пищевая, лекарственная, в том числе
    У меня появились высыпания на коже, какие процедуры в вашем центре помогут их избавиться и как их можно избежать в будущем?
    стоимость приема от: 3200 руб (средняя стоимость приема); стаж: 5 лет; пациенты: взрослые; тип приёма: в клинике; клиника: центр медицины и косметологии balance; варшавская, дубровка, нагатинская, москворечье; венеролог, дерматолог, косметолог, дерматовенеролог; специализация: инъекционная, неинвазивная, аппаратная
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • num_train_epochs: 10.0

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 8
  • per_device_eval_batch_size: 8
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 10.0
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss
2.6596 500 0.0161
5.3191 1000 0.0382
7.9787 1500 0.0367

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.0.1
  • Transformers: 4.42.4
  • PyTorch: 2.4.0+cu121
  • Accelerate: 0.32.1
  • Datasets: 2.21.0
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply}, 
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
14
Safetensors
Model size
118M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for Mykes/med-MiniLM-L12-v2