---
base_model: ai-forever/ru-en-RoSBERTa
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:19988
- loss:MultipleNegativesRankingLoss
- loss:BatchHardSoftMarginTripletLoss
widget:
- source_sentence: Продам учебники для 1ого класса для русского сектора (по программе
Евро2000). 100 лари
sentences:
- Заказывали картку не подошло по размеру продам за 20 лар размеры длина спины 38.5
обхват в груди 60
- Купите малышку🙏🏻🙏🏻🙏🏻
- 'MacBook air m2 15 Inch 8/512 (фактически два раза быстрее конфигурации 8/256) Макбук
в состояние нового, ни царапинки 5 циклов заряда Оригинальный комплект Комфортный
осмотр Проверки приветствуются! Цена: 3790 лари'
- source_sentence: ⚠️⚠️⚠️⚠️⚠️⚠️⚠️ ОБМЕН НА ЗЕМЕЛЬНЫЙ УЧАСТОК ЯЛТА ИЛИ РЯДОМ⚠️⚠️⚠️⚠️⚠️⚠️ 🔥🔥🔥🔥🔥🔥🔥🔥🔥ЭЛИТНЫЙ
ПРИГОРОД ГОРОДА РОСТОВ НА ДОНУ🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥🔥
sentences:
- Куплю да чемодана больших . Размер 75 -50-30
- Продаю новый перфоратор за 130 лари
- Набор для обучения чтению. Всё новое, 40 лари
- source_sentence: Отдам в хорошие руки ненужные игрушки, всей семьей решили очистить
дом.
sentences:
- Кто продает строительные леса в Москве?
- Ищу работу как разработчик на PHP, можно удаленно, зарплата от 100к.
- Срочно ищу игрушки для детей, кто что продает?
- source_sentence: Продам набор столовых приборов из серебра, 12 персон, в идеальном
состоянии, покупался за 50 тысяч, отдам за 30 тысяч.
sentences:
- Ищу набор столовых приборов, желательно из серебра, в хорошем состоянии, по доступной
цене.
- Ищу крысу декоративную, Москва.
- Нужны строители на строительство дома, оплата хорошая, звоните по номеру в профиле.
- source_sentence: Продаю попугайчика, очень веселый, 5 лет, цена 3000 рублей.
sentences:
- Куплю комнатное растение сирень
- Нужен попугай, люблю этих птичек, вдруг кто-то продает.
- Ищу недорогой автомобиль для поездок по деревне, бюджет до 200 тысяч.
---
# SentenceTransformer based on ai-forever/ru-en-RoSBERTa
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [ai-forever/ru-en-RoSBERTa](https://huggingface.co/ai-forever/ru-en-RoSBERTa) on the match-pairs and clusters datasets. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [ai-forever/ru-en-RoSBERTa](https://huggingface.co/ai-forever/ru-en-RoSBERTa)
- **Maximum Sequence Length:** 128 tokens
- **Output Dimensionality:** 1024 tokens
- **Similarity Function:** Cosine Similarity
- **Training Datasets:**
- match-pairs
- clusters
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("poc-embeddings/ru-en-RoSBERTa-trade-magnet")
# Run inference
sentences = [
'Продаю попугайчика, очень веселый, 5 лет, цена 3000 рублей.',
'Нужен попугай, люблю этих птичек, вдруг кто-то продает.',
'Ищу недорогой автомобиль для поездок по деревне, бюджет до 200 тысяч.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
## Training Details
### Training Datasets
#### match-pairs
* Dataset: match-pairs
* Size: 536 training samples
* Columns: anchor
and positive
* Approximate statistics based on the first 536 samples:
| | anchor | positive |
|:--------|:----------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|
| type | string | string |
| details |
Ищу работу HR-менеджера, опыт 4 года, знание трудового законодательства.
| Требуется HR-менеджер с опытом работы и знанием трудового законодательства.
|
| Акция на косметику, 3 по цене 2, только до конца недели!
| Кто видел скидки на косметику в последних рекламках?
|
| Продам ковер ручной работы из шерсти, из Ирана, размер 2х3 метра, состояние отличное, покупался за 150 тысяч, отдам за 100 тысяч.
| Ищу ковер из натуральных материалов, размер 2х3 метра, в хорошем состоянии, по адекватной цене.
|
* Loss: [MultipleNegativesRankingLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
#### clusters
* Dataset: clusters
* Size: 19,452 training samples
* Columns: sentence
and label
* Approximate statistics based on the first 1000 samples:
| | sentence | label |
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| type | string | int |
| details | Продам кроссовки New Balance 574 Новые. Размер: 9 US, 42.5 EU Цена: 250 лари Больше моделей в шапке профиля.
| 31
|
| Куплю Новый MagicQ MQ250M
| 27
|
| КУПЛЮ iPhone 6s, 7, 8 возможно с дефектом‼️
| 15
|
* Loss: [BatchHardSoftMarginTripletLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#batchhardsoftmargintripletloss)
### Evaluation Datasets
#### match-pairs
* Dataset: match-pairs
* Size: 536 evaluation samples
* Columns: anchor
and positive
* Approximate statistics based on the first 536 samples:
| | anchor | positive |
|:--------|:-----------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|
| type | string | string |
| details | Отдам бульдозер Komatsu, почти новый, Ростов-на-Дону, 4 млн рублей.
| Кто продает бульдозер Komatsu в Ростове-на-Дону?
|
| Нужен PHP-разработчик, удаленка, ЗП до 150к.
| Ищу работу как разработчик на PHP, можно удаленно, зарплата от 100к.
|
| Ищу программиста Python, нужен опытный человек, чтобы сделать сайт для компании, пишите в личку, обсудим детали.
| Программист python, опыт работы 2 года.
|
* Loss: [MultipleNegativesRankingLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
#### clusters
* Dataset: clusters
* Size: 19,452 evaluation samples
* Columns: sentence
and label
* Approximate statistics based on the first 1000 samples:
| | sentence | label |
|:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| type | string | int |
| details | Куплю клетчатую сумку с замком, либо подобную, пишите в лс
| 1
|
| asus r 752 l - 1tb HDD, 12gb ddr3, nvidia GeForce 940, intel core i7 5500u - 550 лари.
| 14
|
| срочно Продам геймпад Defender X7 с держателем для телефона Состояние - новый 1300р.
| 15
|
* Loss: [BatchHardSoftMarginTripletLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#batchhardsoftmargintripletloss)
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 128
- `per_device_eval_batch_size`: 128
- `learning_rate`: 2e-05
- `weight_decay`: 0.022
- `num_train_epochs`: 5
- `lr_scheduler_type`: cosine
- `warmup_ratio`: 0.17
- `fp16`: True
- `dataloader_num_workers`: 8
#### All Hyperparameters