---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:80373602
- loss:RZTKMatryoshka2dLoss
base_model: intfloat/multilingual-e5-base
widget:
- source_sentence: 'query: опдушка масажер'
sentences:
- 'passage: Обкладинка для зошитів ZiBi А5+ 100мкм прозора (ZB.4704) Обкладинки
для зошитів і підручників ZiBi Колір Прозорий Тип Обкладинки Вид Для зошитів'
- 'passage: Газова варильна панель ELEGANT GH 2100 Варильні поверхні газові Elegant
Гарантія 12 місяців Кількість конфорок 2 Керування Поворотні перемикачі Матеріал
поверхні Загартоване скло Вид поверхні Domino Розташування панелі керування Фронтальне
Матеріал решіток Чавун Тип електрозапалювання Автоматичний (у ручці) Тип використовуваного
газу Природний газ Тип використовуваного газу Бутан/зріджений Колір Чорний Країна-виробник
товару Китай'
- 'passage: Масажна подушка Magic Massager Pillow 8028 для будинку і машини Масажери
Magic Вид масажера Масажний пояс Вид масажера Масажна подушка Вид масажера Масажна
підставка Вид масажера Масажний комір Живлення Мережа Живлення Прикурювач теги
домашні теги електричні'
- source_sentence: 'query: смєсітель для раковини'
sentences:
- 'passage: Електрична щітка для прибирання Magic Brush 5в1 Віники та щітки Magic
Brush Гарантія 14 днів Країна-виробник товару Китай Матеріал Пластик Колір Білий
Тип Щітки Вид Електричні Призначення Універсальні Призначення Для чищення кухні
Призначення Для чищення ванної'
- 'passage: Машинка для видалення катишек від мережі 220в 5вт Lint Remover UKC YX
5880 Біло-синя Машинки для відстригання ковтунців UKC Країна реєстрації бренда
Китай Комплектація Захисна кришка для лез Колір Білий / Блакитний Доставка Доставка
в магазини ROZETKA'
- 'passage: Змішувач-кран для раковини TAU SM-2A144C Змішувачі для раковини Tau
Гарантія 12 місяців офіційної гарантії від виробника Тип виливу Стаціонарний Вид
монтажу Врізний Вид змішувача Одноважільний Спосіб монтажу На 1 отвір Термостат
Немає Матеріал Силумін Колір Хром Кількість вантажних місць 1 Країна реєстрації
бренда Україна Країна-виробник товару Китай Шланги під''єднання Входять до комплекту
постачання Діаметр під''єднання шлангів 1/2" Шланги На різьбі Тип гарантійного
талона Гарантія по чеку Можливість доставки Почтомати Доставка Доставка в магазини
ROZETKA'
- source_sentence: 'query: эхилс'
sentences:
- 'passage: Пульсоксиметр AHealth AH OXI100 Black (EP805178) - Уценка Уцененная
мелкая бытовая техника Ahealth Гарантия 14 дней Количество грузовых мест 1 Страна
регистрации бренда Китай Страна-производитель товара Китай Тип гарантийного талона
Гарантийный талон магазина'
- 'passage: Пильное полотно для сабельной пилы DeWalt Alligator 275 мм (DT2963)
Пильные полотна Stanley Рабочая длина 275 мм Тип реза Прямой Вид Полотна Страна
регистрации бренда США Количество предметов, шт 1 Страна-производитель товара
Чехия теги пильное полотно для сабельной пилы теги пильное полотно универсальное'
- 'passage: Коляска прогулочная BabyHit Nano Denim (23_299) Детские коляски BabyHit
Гарантия 6 месяцев Тип Прогулочные Ремни безопасности 5-ти точечные Регулировка
спинки Многопозиционная плавная регулировка Основной цвет Серый Пол ребенка Девочка
Пол ребенка Мальчик Максимальный вес ребенка, кг 18 Поворотность колес Поворотные
Количество грузовых мест 1 Вес коляски, кг 6.7 Страна регистрации бренда Украина
Страна-производитель товара Китай теги летние теги лучшие теги складные теги зимние
теги стильные теги недорого Тип гарантийного талона Оригинальный гарантийный талон
Доставка Premium Тип колес Литые Конструкция Багажная корзина'
- source_sentence: 'query: антена т2'
sentences:
- 'passage: Антенна комнатная Energy Феномен Т2 с усилителем (PH_T2_U) Антенны Energy
Принимаемый сигнал Цифровой Стандарты цифрового ТВ DVB-T2 Тип Комнатные Страна
регистрации бренда Украина Страна-производитель товара Германия'
- 'passage: Мужские резиновые сапоги высокие Jose Amorales 118150 46 Хаки (2201181504600)
Мужские резиновые сапоги Jose Amorales Цвет Зеленый Материал верха EVA (этиленвинилацетат)
Материал подкладки EVA Материал подошвы EVA (этиленвинилацетат) Размер 46 Сезон
Демисезонный Сезон Осенний Сезон Весенний Количество грузовых мест 1 Страна регистрации
бренда Украина Страна-производитель товара Украина Назначение Для повседневной
носки Назначение Для охоты Назначение Для рыбалки Высота изделия Высокие Застежка
Без застежки Доставка Доставка в магазины ROZETKA'
- 'passage: Рюкзак Cool For School 46х30х18 см 15 л (CF86258) Школьные рюкзаки и
ранцы Cool For School Гарантия 14 дней Тип Рюкзаки Комплектация Ранец Цвет Розовый
с салатовым Пол Для девочек Материал Полиэстер Вид Подростковые Размер (рост)
L (145 - 175 см) Количество грузовых мест 1 Страна регистрации бренда Германия
Страна-производитель товара Китай Вес, г 830 Тип гарантийного талона Гарантия
по чеку Спинка Анатомическая Доставка Premium Доставка Доставка в магазины ROZETKA'
- source_sentence: 'query: чоловічіпіжами'
sentences:
- 'passage: Пижамные штаны мужские Vienetta XL синий 311236 Мужские пижамы Vienetta'
- 'passage: ИБП для роутера MARSRIVA KP7 UPS для роутеров 24000 mAh LiFePo4 100W
DCx10/Gigabit PoE(24/48V) (KP7_MARSRIVA) Источники бесперебойного питания MARSRIVA
Тип архитектуры Резервные (off-line) EAN 4897065473506 Страна-производитель товара
Китай Аккумуляторная батарея Встроенная Номинальная мощность 100 Вт Особенности
С дисплеем Назначение Для видеонаблюдения Назначение Для роутера Интерфейсы RJ-45
Тип монтажа Настольные/вертикальные (mini tower)'
- 'passage: Зарядная станция EcoFlow DELTA 2 (ZMR330-EU) Зарядные станции EcoFlow
Тип аккумуляторов Литий-железо-фосфатные (LiFePO4) Назначение Для всего дома Особенности
Быстрая зарядка батареи Страна-производитель товара Китай Выходные интерфейсы
USB Type A Выходные интерфейсы USB Type C Емкость зарядной станции, Вт*ч 1024
Выходная мощность (общая), Вт 1800 Максимальная мощность устройств, Вт 2400 Тип
(версия) розеток Европейская Количество портов USB Type A 2 Количество портов
USB Type С 2 Количество розеток 4'
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- dot_accuracy_1
- dot_accuracy_3
- dot_accuracy_5
- dot_accuracy_10
- dot_precision_1
- dot_precision_3
- dot_precision_5
- dot_precision_10
- dot_recall_1
- dot_recall_3
- dot_recall_5
- dot_recall_10
- dot_ndcg_10
- dot_mrr_10
- dot_map_60
- dot_ndcg_1
- dot_mrr_1
- avg--matryoshka_dim-768--_dot_accuracy_1
- avg--matryoshka_dim-768--_dot_precision_1
- avg--matryoshka_dim-768--_dot_recall_1
- avg--matryoshka_dim-768--_dot_ndcg_1
- avg--matryoshka_dim-768--_dot_mrr_1
- avg--matryoshka_dim-768--_dot_map_60
- avg--matryoshka_dim-512--_dot_accuracy_1
- avg--matryoshka_dim-512--_dot_precision_1
- avg--matryoshka_dim-512--_dot_recall_1
- avg--matryoshka_dim-512--_dot_ndcg_1
- avg--matryoshka_dim-512--_dot_mrr_1
- avg--matryoshka_dim-512--_dot_map_60
- avg--matryoshka_dim-256--_dot_accuracy_1
- avg--matryoshka_dim-256--_dot_precision_1
- avg--matryoshka_dim-256--_dot_recall_1
- avg--matryoshka_dim-256--_dot_ndcg_1
- avg--matryoshka_dim-256--_dot_mrr_1
- avg--matryoshka_dim-256--_dot_map_60
- avg--matryoshka_dim-128--_dot_accuracy_1
- avg--matryoshka_dim-128--_dot_precision_1
- avg--matryoshka_dim-128--_dot_recall_1
- avg--matryoshka_dim-128--_dot_ndcg_1
- avg--matryoshka_dim-128--_dot_mrr_1
- avg--matryoshka_dim-128--_dot_map_60
model-index:
- name: SentenceTransformer based on intfloat/multilingual-e5-base
results:
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: core uk
type: core-uk
metrics:
- type: dot_accuracy_1
value: 0.8320209973753281
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.94750656167979
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9763779527559056
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9973753280839895
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8320209973753281
name: Dot Precision 1
- type: dot_precision_3
value: 0.7559055118110236
name: Dot Precision 3
- type: dot_precision_5
value: 0.6664041994750657
name: Dot Precision 5
- type: dot_precision_10
value: 0.4056430446194226
name: Dot Precision 10
- type: dot_recall_1
value: 0.1294088238970129
name: Dot Recall 1
- type: dot_recall_3
value: 0.3004817106195059
name: Dot Recall 3
- type: dot_recall_5
value: 0.4111832375119777
name: Dot Recall 5
- type: dot_recall_10
value: 0.4830919572553431
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5994753579249453
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8934778985960088
name: Dot Mrr 10
- type: dot_map_60
value: 0.4285503952344978
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: core ru
type: core-ru
metrics:
- type: dot_accuracy_1
value: 0.8346456692913385
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9461942257217848
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9803149606299213
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9986876640419947
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8346456692913385
name: Dot Precision 1
- type: dot_precision_3
value: 0.752843394575678
name: Dot Precision 3
- type: dot_precision_5
value: 0.6669291338582678
name: Dot Precision 5
- type: dot_precision_10
value: 0.4053805774278215
name: Dot Precision 10
- type: dot_recall_1
value: 0.1298212723409574
name: Dot Recall 1
- type: dot_recall_3
value: 0.30101445652626757
name: Dot Recall 3
- type: dot_recall_5
value: 0.41294421530642006
name: Dot Recall 5
- type: dot_recall_10
value: 0.48331536682914633
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5999177342891409
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8957770903637045
name: Dot Mrr 10
- type: dot_map_60
value: 0.4288323595676725
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: typos uk
type: typos-uk
metrics:
- type: dot_accuracy_1
value: 0.7926509186351706
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.926509186351706
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9606299212598425
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9881889763779528
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.7926509186351706
name: Dot Precision 1
- type: dot_precision_3
value: 0.7309711286089239
name: Dot Precision 3
- type: dot_precision_5
value: 0.6435695538057743
name: Dot Precision 5
- type: dot_precision_10
value: 0.3959317585301838
name: Dot Precision 10
- type: dot_recall_1
value: 0.12145825521809774
name: Dot Recall 1
- type: dot_recall_3
value: 0.29012180769070534
name: Dot Recall 3
- type: dot_recall_5
value: 0.3967324396950382
name: Dot Recall 5
- type: dot_recall_10
value: 0.4715975607215765
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.581057500412081
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8658652043494561
name: Dot Mrr 10
- type: dot_map_60
value: 0.41400075029211947
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: typos ru
type: typos-ru
metrics:
- type: dot_accuracy_1
value: 0.7965879265091863
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9199475065616798
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.963254593175853
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.989501312335958
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.7965879265091863
name: Dot Precision 1
- type: dot_precision_3
value: 0.7270341207349081
name: Dot Precision 3
- type: dot_precision_5
value: 0.6396325459317586
name: Dot Precision 5
- type: dot_precision_10
value: 0.3948818897637796
name: Dot Precision 10
- type: dot_recall_1
value: 0.12179649418822647
name: Dot Recall 1
- type: dot_recall_3
value: 0.28828245427654875
name: Dot Recall 3
- type: dot_recall_5
value: 0.3952852247635713
name: Dot Recall 5
- type: dot_recall_10
value: 0.4706044556930384
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5798984116038256
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8671061950589508
name: Dot Mrr 10
- type: dot_map_60
value: 0.4131583411852339
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: transliterations uk
type: transliterations-uk
metrics:
- type: dot_accuracy_1
value: 0.766153187847668
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.8483097988874626
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.8744116388532306
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9054343175010697
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.766153187847668
name: Dot Precision 1
- type: dot_precision_3
value: 0.5064898017401227
name: Dot Precision 3
- type: dot_precision_5
value: 0.3891313649978605
name: Dot Precision 5
- type: dot_precision_10
value: 0.2199186991869919
name: Dot Precision 10
- type: dot_recall_1
value: 0.23275324999490593
name: Dot Recall 1
- type: dot_recall_3
value: 0.3420168816349818
name: Dot Recall 3
- type: dot_recall_5
value: 0.39086346455569815
name: Dot Recall 5
- type: dot_recall_10
value: 0.4211309523809524
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.508956301515974
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8126512079657152
name: Dot Mrr 10
- type: dot_map_60
value: 0.38863579771140444
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: transliterations ru
type: transliterations-ru
metrics:
- type: dot_accuracy_1
value: 0.7794180573384681
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.8525887890457852
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.8784766795036372
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9080017115960634
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.7794180573384681
name: Dot Precision 1
- type: dot_precision_3
value: 0.5122664384538581
name: Dot Precision 3
- type: dot_precision_5
value: 0.39323919554985026
name: Dot Precision 5
- type: dot_precision_10
value: 0.22148053059477968
name: Dot Precision 10
- type: dot_recall_1
value: 0.23682618640096179
name: Dot Recall 1
- type: dot_recall_3
value: 0.3456468916192922
name: Dot Recall 3
- type: dot_recall_5
value: 0.3944142622817206
name: Dot Recall 5
- type: dot_recall_10
value: 0.42375527232715937
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5144322784291283
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8216956687110742
name: Dot Mrr 10
- type: dot_map_60
value: 0.39385691972827114
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: options uk
type: options-uk
metrics:
- type: dot_accuracy_1
value: 0.8446601941747572
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9490291262135923
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9781553398058253
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 1.0
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8446601941747572
name: Dot Precision 1
- type: dot_precision_3
value: 0.7718446601941747
name: Dot Precision 3
- type: dot_precision_5
value: 0.6063106796116504
name: Dot Precision 5
- type: dot_precision_10
value: 0.34199029126213587
name: Dot Precision 10
- type: dot_recall_1
value: 0.1310188395746648
name: Dot Recall 1
- type: dot_recall_3
value: 0.3430969717984281
name: Dot Recall 3
- type: dot_recall_5
value: 0.4379926606564956
name: Dot Recall 5
- type: dot_recall_10
value: 0.4892495954692557
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5858350840228177
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.90125693481276
name: Dot Mrr 10
- type: dot_map_60
value: 0.42688614899222255
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: options ru
type: options-ru
metrics:
- type: dot_accuracy_1
value: 0.8495145631067961
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9514563106796117
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9805825242718447
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 1.0
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8495145631067961
name: Dot Precision 1
- type: dot_precision_3
value: 0.7783171521035598
name: Dot Precision 3
- type: dot_precision_5
value: 0.6087378640776698
name: Dot Precision 5
- type: dot_precision_10
value: 0.34271844660194173
name: Dot Precision 10
- type: dot_recall_1
value: 0.1317267683772538
name: Dot Recall 1
- type: dot_recall_3
value: 0.34499826629680996
name: Dot Recall 3
- type: dot_recall_5
value: 0.4391657998150717
name: Dot Recall 5
- type: dot_recall_10
value: 0.4902204692556634
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.5876954008561657
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.9059263754045306
name: Dot Mrr 10
- type: dot_map_60
value: 0.4279393522239147
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: rusisms uk
type: rusisms-uk
metrics:
- type: dot_accuracy_1
value: 0.9340659340659341
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.989010989010989
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.989010989010989
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 1.0
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.9340659340659341
name: Dot Precision 1
- type: dot_precision_3
value: 0.8974358974358974
name: Dot Precision 3
- type: dot_precision_5
value: 0.8439560439560441
name: Dot Precision 5
- type: dot_precision_10
value: 0.7340659340659342
name: Dot Precision 10
- type: dot_recall_1
value: 0.08706599171628739
name: Dot Recall 1
- type: dot_recall_3
value: 0.19989710864841587
name: Dot Recall 3
- type: dot_recall_5
value: 0.2688343218652121
name: Dot Recall 5
- type: dot_recall_10
value: 0.38334910122810867
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.8345600775728184
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.9633699633699633
name: Dot Mrr 10
- type: dot_map_60
value: 0.47742090449338376
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: rusisms ru
type: rusisms-ru
metrics:
- type: dot_accuracy_1
value: 0.9340659340659341
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.967032967032967
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.989010989010989
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 1.0
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.9340659340659341
name: Dot Precision 1
- type: dot_precision_3
value: 0.8901098901098901
name: Dot Precision 3
- type: dot_precision_5
value: 0.8351648351648352
name: Dot Precision 5
- type: dot_precision_10
value: 0.7307692307692307
name: Dot Precision 10
- type: dot_recall_1
value: 0.08679126644156213
name: Dot Recall 1
- type: dot_recall_3
value: 0.19670833313821182
name: Dot Recall 3
- type: dot_recall_5
value: 0.26506993149367886
name: Dot Recall 5
- type: dot_recall_10
value: 0.37986353450724775
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.829925608135021
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.9568681318681319
name: Dot Mrr 10
- type: dot_map_60
value: 0.47418152230283284
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: jargonisms uk
type: jargonisms-uk
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9487179487179487
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9743589743589743
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9743589743589743
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_precision_3
value: 0.8034188034188033
name: Dot Precision 3
- type: dot_precision_5
value: 0.764102564102564
name: Dot Precision 5
- type: dot_precision_10
value: 0.6410256410256411
name: Dot Precision 10
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_recall_3
value: 0.23257036314816631
name: Dot Recall 3
- type: dot_recall_5
value: 0.31969907899541766
name: Dot Recall 5
- type: dot_recall_10
value: 0.4288263224189998
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.7773893071603697
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.9239316239316239
name: Dot Mrr 10
- type: dot_map_60
value: 0.45570765102853333
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: jargonisms ru
type: jargonisms-ru
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9487179487179487
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9743589743589743
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9743589743589743
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_precision_3
value: 0.7948717948717948
name: Dot Precision 3
- type: dot_precision_5
value: 0.758974358974359
name: Dot Precision 5
- type: dot_precision_10
value: 0.6384615384615385
name: Dot Precision 10
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_recall_3
value: 0.2307388613166645
name: Dot Recall 3
- type: dot_recall_5
value: 0.31713497643131505
name: Dot Recall 5
- type: dot_recall_10
value: 0.4275442711369486
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.7742726554934242
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.9239316239316239
name: Dot Mrr 10
- type: dot_map_60
value: 0.4534919139776314
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: vespa uk
type: vespa-uk
metrics:
- type: dot_accuracy_1
value: 0.8695652173913043
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.9021739130434783
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.9130434782608695
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9239130434782609
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8695652173913043
name: Dot Precision 1
- type: dot_precision_3
value: 0.8043478260869565
name: Dot Precision 3
- type: dot_precision_5
value: 0.7717391304347826
name: Dot Precision 5
- type: dot_precision_10
value: 0.6836956521739131
name: Dot Precision 10
- type: dot_recall_1
value: 0.06883175868145536
name: Dot Recall 1
- type: dot_recall_3
value: 0.14103572265779404
name: Dot Recall 3
- type: dot_recall_5
value: 0.18398521310559096
name: Dot Recall 5
- type: dot_recall_10
value: 0.23868263992848113
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.7717438650633948
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8856280193236714
name: Dot Mrr 10
- type: dot_map_60
value: 0.5732330257602632
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: vespa ru
type: vespa-ru
metrics:
- type: dot_accuracy_1
value: 0.8369565217391305
name: Dot Accuracy 1
- type: dot_accuracy_3
value: 0.8913043478260869
name: Dot Accuracy 3
- type: dot_accuracy_5
value: 0.8913043478260869
name: Dot Accuracy 5
- type: dot_accuracy_10
value: 0.9021739130434783
name: Dot Accuracy 10
- type: dot_precision_1
value: 0.8369565217391305
name: Dot Precision 1
- type: dot_precision_3
value: 0.8007246376811594
name: Dot Precision 3
- type: dot_precision_5
value: 0.7543478260869566
name: Dot Precision 5
- type: dot_precision_10
value: 0.6804347826086957
name: Dot Precision 10
- type: dot_recall_1
value: 0.06224227191657334
name: Dot Recall 1
- type: dot_recall_3
value: 0.13528086322210459
name: Dot Recall 3
- type: dot_recall_5
value: 0.1739478766654453
name: Dot Recall 5
- type: dot_recall_10
value: 0.23048904916705776
name: Dot Recall 10
- type: dot_ndcg_10
value: 0.7605101400743094
name: Dot Ndcg 10
- type: dot_mrr_10
value: 0.8641304347826086
name: Dot Mrr 10
- type: dot_map_60
value: 0.565160646959096
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core uk matryoshka dim 768 '
type: core-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8320209973753281
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8320209973753281
name: Dot Precision 1
- type: dot_recall_1
value: 0.1294088238970129
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8320209973753281
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8320209973753281
name: Dot Mrr 1
- type: dot_map_60
value: 0.4285503952344978
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core ru matryoshka dim 768 '
type: core-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8346456692913385
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8346456692913385
name: Dot Precision 1
- type: dot_recall_1
value: 0.1298212723409574
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8346456692913385
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8346456692913385
name: Dot Mrr 1
- type: dot_map_60
value: 0.4288323595676725
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos uk matryoshka dim 768 '
type: typos-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.7926509186351706
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7926509186351706
name: Dot Precision 1
- type: dot_recall_1
value: 0.12145825521809774
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7926509186351706
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7926509186351706
name: Dot Mrr 1
- type: dot_map_60
value: 0.41400075029211947
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos ru matryoshka dim 768 '
type: typos-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.7965879265091863
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7965879265091863
name: Dot Precision 1
- type: dot_recall_1
value: 0.12179649418822647
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7965879265091863
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7965879265091863
name: Dot Mrr 1
- type: dot_map_60
value: 0.4131583411852339
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations uk matryoshka dim 768 '
type: transliterations-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.766153187847668
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.766153187847668
name: Dot Precision 1
- type: dot_recall_1
value: 0.23275324999490593
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.766153187847668
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.766153187847668
name: Dot Mrr 1
- type: dot_map_60
value: 0.38863579771140444
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations ru matryoshka dim 768 '
type: transliterations-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.7794180573384681
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7794180573384681
name: Dot Precision 1
- type: dot_recall_1
value: 0.23682618640096179
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7794180573384681
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7794180573384681
name: Dot Mrr 1
- type: dot_map_60
value: 0.39385691972827114
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options uk matryoshka dim 768 '
type: options-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8446601941747572
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8446601941747572
name: Dot Precision 1
- type: dot_recall_1
value: 0.1310188395746648
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8446601941747572
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8446601941747572
name: Dot Mrr 1
- type: dot_map_60
value: 0.42688614899222255
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options ru matryoshka dim 768 '
type: options-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8495145631067961
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8495145631067961
name: Dot Precision 1
- type: dot_recall_1
value: 0.1317267683772538
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8495145631067961
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8495145631067961
name: Dot Mrr 1
- type: dot_map_60
value: 0.4279393522239147
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms uk matryoshka dim 768 '
type: rusisms-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.9340659340659341
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9340659340659341
name: Dot Precision 1
- type: dot_recall_1
value: 0.08706599171628739
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9340659340659341
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9340659340659341
name: Dot Mrr 1
- type: dot_map_60
value: 0.47742090449338376
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms ru matryoshka dim 768 '
type: rusisms-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.9340659340659341
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9340659340659341
name: Dot Precision 1
- type: dot_recall_1
value: 0.08679126644156213
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9340659340659341
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9340659340659341
name: Dot Mrr 1
- type: dot_map_60
value: 0.47418152230283284
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms uk matryoshka dim 768 '
type: jargonisms-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.45570765102853333
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms ru matryoshka dim 768 '
type: jargonisms-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.4534919139776314
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa uk matryoshka dim 768 '
type: vespa-uk--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8695652173913043
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8695652173913043
name: Dot Precision 1
- type: dot_recall_1
value: 0.06883175868145536
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8695652173913043
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8695652173913043
name: Dot Mrr 1
- type: dot_map_60
value: 0.5732330257602632
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa ru matryoshka dim 768 '
type: vespa-ru--matryoshka_dim-768--
metrics:
- type: dot_accuracy_1
value: 0.8369565217391305
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8369565217391305
name: Dot Precision 1
- type: dot_recall_1
value: 0.06224227191657334
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8369565217391305
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8369565217391305
name: Dot Mrr 1
- type: dot_map_60
value: 0.565160646959096
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core uk matryoshka dim 512 '
type: core-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.821522309711286
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.821522309711286
name: Dot Precision 1
- type: dot_recall_1
value: 0.1292119735033121
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.821522309711286
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.821522309711286
name: Dot Mrr 1
- type: dot_map_60
value: 0.4275924113816673
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core ru matryoshka dim 512 '
type: core-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8188976377952756
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8188976377952756
name: Dot Precision 1
- type: dot_recall_1
value: 0.12844540265800108
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8188976377952756
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8188976377952756
name: Dot Mrr 1
- type: dot_map_60
value: 0.4273910265590936
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos uk matryoshka dim 512 '
type: typos-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.7795275590551181
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7795275590551181
name: Dot Precision 1
- type: dot_recall_1
value: 0.12051774778152732
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7795275590551181
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7795275590551181
name: Dot Mrr 1
- type: dot_map_60
value: 0.41040405788146145
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos ru matryoshka dim 512 '
type: typos-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.7782152230971129
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7782152230971129
name: Dot Precision 1
- type: dot_recall_1
value: 0.11916375036453776
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7782152230971129
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7782152230971129
name: Dot Mrr 1
- type: dot_map_60
value: 0.40931753436850665
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations uk matryoshka dim 512 '
type: transliterations-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.751604621309371
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.751604621309371
name: Dot Precision 1
- type: dot_recall_1
value: 0.22918742486297042
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.751604621309371
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.751604621309371
name: Dot Mrr 1
- type: dot_map_60
value: 0.3818314123132323
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations ru matryoshka dim 512 '
type: transliterations-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.7655113393239196
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7655113393239196
name: Dot Precision 1
- type: dot_recall_1
value: 0.2339432167817919
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7655113393239196
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7655113393239196
name: Dot Mrr 1
- type: dot_map_60
value: 0.387110849655481
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options uk matryoshka dim 512 '
type: options-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8398058252427184
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8398058252427184
name: Dot Precision 1
- type: dot_recall_1
value: 0.13041204345816
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8398058252427184
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8398058252427184
name: Dot Mrr 1
- type: dot_map_60
value: 0.4262844115027504
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options ru matryoshka dim 512 '
type: options-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8398058252427184
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8398058252427184
name: Dot Precision 1
- type: dot_recall_1
value: 0.1305131761442441
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8398058252427184
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8398058252427184
name: Dot Mrr 1
- type: dot_map_60
value: 0.4269223943661596
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms uk matryoshka dim 512 '
type: rusisms-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.945054945054945
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.945054945054945
name: Dot Precision 1
- type: dot_recall_1
value: 0.0870529095603481
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.945054945054945
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.945054945054945
name: Dot Mrr 1
- type: dot_map_60
value: 0.47622797404209144
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms ru matryoshka dim 512 '
type: rusisms-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.945054945054945
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.945054945054945
name: Dot Precision 1
- type: dot_recall_1
value: 0.0870529095603481
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.945054945054945
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.945054945054945
name: Dot Mrr 1
- type: dot_map_60
value: 0.47487533195888043
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms uk matryoshka dim 512 '
type: jargonisms-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.45529622369157835
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms ru matryoshka dim 512 '
type: jargonisms-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.4537336247678682
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa uk matryoshka dim 512 '
type: vespa-uk--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8478260869565217
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8478260869565217
name: Dot Precision 1
- type: dot_recall_1
value: 0.06826609763442786
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8478260869565217
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8478260869565217
name: Dot Mrr 1
- type: dot_map_60
value: 0.573179058797186
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa ru matryoshka dim 512 '
type: vespa-ru--matryoshka_dim-512--
metrics:
- type: dot_accuracy_1
value: 0.8478260869565217
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8478260869565217
name: Dot Precision 1
- type: dot_recall_1
value: 0.06292161974266029
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8478260869565217
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8478260869565217
name: Dot Mrr 1
- type: dot_map_60
value: 0.5640163373561312
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core uk matryoshka dim 256 '
type: core-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8123359580052494
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8123359580052494
name: Dot Precision 1
- type: dot_recall_1
value: 0.12785563262925467
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8123359580052494
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8123359580052494
name: Dot Mrr 1
- type: dot_map_60
value: 0.4231521702068554
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core ru matryoshka dim 256 '
type: core-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8123359580052494
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8123359580052494
name: Dot Precision 1
- type: dot_recall_1
value: 0.1277462712994209
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8123359580052494
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8123359580052494
name: Dot Mrr 1
- type: dot_map_60
value: 0.4232948634132667
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos uk matryoshka dim 256 '
type: typos-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.7821522309711286
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7821522309711286
name: Dot Precision 1
- type: dot_recall_1
value: 0.1204448402283048
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7821522309711286
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7821522309711286
name: Dot Mrr 1
- type: dot_map_60
value: 0.4048477669980251
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos ru matryoshka dim 256 '
type: typos-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.7742782152230971
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7742782152230971
name: Dot Precision 1
- type: dot_recall_1
value: 0.11884113444152813
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7742782152230971
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7742782152230971
name: Dot Mrr 1
- type: dot_map_60
value: 0.40389791132760394
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations uk matryoshka dim 256 '
type: transliterations-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.7225074882327771
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7225074882327771
name: Dot Precision 1
- type: dot_recall_1
value: 0.22269838722823318
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7225074882327771
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7225074882327771
name: Dot Mrr 1
- type: dot_map_60
value: 0.36538168857405573
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations ru matryoshka dim 256 '
type: transliterations-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.7334189131364998
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7334189131364998
name: Dot Precision 1
- type: dot_recall_1
value: 0.22648160034231923
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7334189131364998
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7334189131364998
name: Dot Mrr 1
- type: dot_map_60
value: 0.37079946410146875
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options uk matryoshka dim 256 '
type: options-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8398058252427184
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8398058252427184
name: Dot Precision 1
- type: dot_recall_1
value: 0.13063453536754507
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8398058252427184
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8398058252427184
name: Dot Mrr 1
- type: dot_map_60
value: 0.4210579878658755
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options ru matryoshka dim 256 '
type: options-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.837378640776699
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.837378640776699
name: Dot Precision 1
- type: dot_recall_1
value: 0.1302300046232085
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.837378640776699
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.837378640776699
name: Dot Mrr 1
- type: dot_map_60
value: 0.4212571504782112
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms uk matryoshka dim 256 '
type: rusisms-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.945054945054945
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.945054945054945
name: Dot Precision 1
- type: dot_recall_1
value: 0.0879386484712971
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.945054945054945
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.945054945054945
name: Dot Mrr 1
- type: dot_map_60
value: 0.47356620314355136
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms ru matryoshka dim 256 '
type: rusisms-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.9340659340659341
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9340659340659341
name: Dot Precision 1
- type: dot_recall_1
value: 0.08656502209767072
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9340659340659341
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9340659340659341
name: Dot Mrr 1
- type: dot_map_60
value: 0.47320492151848786
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms uk matryoshka dim 256 '
type: jargonisms-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1165954934547612
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.4578428190173281
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms ru matryoshka dim 256 '
type: jargonisms-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.9230769230769231
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9230769230769231
name: Dot Precision 1
- type: dot_recall_1
value: 0.12941600627527403
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9230769230769231
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9230769230769231
name: Dot Mrr 1
- type: dot_map_60
value: 0.46545068038766446
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa uk matryoshka dim 256 '
type: vespa-uk--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8586956521739131
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8586956521739131
name: Dot Precision 1
- type: dot_recall_1
value: 0.07324770669918204
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8586956521739131
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8586956521739131
name: Dot Mrr 1
- type: dot_map_60
value: 0.5721859123204845
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa ru matryoshka dim 256 '
type: vespa-ru--matryoshka_dim-256--
metrics:
- type: dot_accuracy_1
value: 0.8369565217391305
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8369565217391305
name: Dot Precision 1
- type: dot_recall_1
value: 0.06201582264121103
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8369565217391305
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8369565217391305
name: Dot Mrr 1
- type: dot_map_60
value: 0.5605933202351481
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core uk matryoshka dim 128 '
type: core-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.7979002624671916
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7979002624671916
name: Dot Precision 1
- type: dot_recall_1
value: 0.125930352455943
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7979002624671916
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7979002624671916
name: Dot Mrr 1
- type: dot_map_60
value: 0.41610108615224095
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'core ru matryoshka dim 128 '
type: core-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.7834645669291339
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7834645669291339
name: Dot Precision 1
- type: dot_recall_1
value: 0.12301561263175437
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7834645669291339
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7834645669291339
name: Dot Mrr 1
- type: dot_map_60
value: 0.41480113379053846
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos uk matryoshka dim 128 '
type: typos-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.7545931758530183
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7545931758530183
name: Dot Precision 1
- type: dot_recall_1
value: 0.11586989126359205
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7545931758530183
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7545931758530183
name: Dot Mrr 1
- type: dot_map_60
value: 0.394110056272876
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'typos ru matryoshka dim 128 '
type: typos-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.7598425196850394
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.7598425196850394
name: Dot Precision 1
- type: dot_recall_1
value: 0.11452318460192476
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.7598425196850394
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.7598425196850394
name: Dot Mrr 1
- type: dot_map_60
value: 0.39449879092923534
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations uk matryoshka dim 128 '
type: transliterations-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.6653829696191699
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.6653829696191699
name: Dot Precision 1
- type: dot_recall_1
value: 0.20764589318825516
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.6653829696191699
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.6653829696191699
name: Dot Mrr 1
- type: dot_map_60
value: 0.3379017658701352
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'transliterations ru matryoshka dim 128 '
type: transliterations-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.6777920410783055
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.6777920410783055
name: Dot Precision 1
- type: dot_recall_1
value: 0.2123706114880698
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.6777920410783055
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.6777920410783055
name: Dot Mrr 1
- type: dot_map_60
value: 0.3442573792878016
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options uk matryoshka dim 128 '
type: options-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8106796116504854
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8106796116504854
name: Dot Precision 1
- type: dot_recall_1
value: 0.1263869625520111
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8106796116504854
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8106796116504854
name: Dot Mrr 1
- type: dot_map_60
value: 0.41121686668183804
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'options ru matryoshka dim 128 '
type: options-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8179611650485437
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8179611650485437
name: Dot Precision 1
- type: dot_recall_1
value: 0.1270948913546001
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8179611650485437
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8179611650485437
name: Dot Mrr 1
- type: dot_map_60
value: 0.41072019781780317
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms uk matryoshka dim 128 '
type: rusisms-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.9230769230769231
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9230769230769231
name: Dot Precision 1
- type: dot_recall_1
value: 0.08488614541879404
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9230769230769231
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9230769230769231
name: Dot Mrr 1
- type: dot_map_60
value: 0.46692078180798774
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'rusisms ru matryoshka dim 128 '
type: rusisms-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.9230769230769231
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.9230769230769231
name: Dot Precision 1
- type: dot_recall_1
value: 0.08653449706714568
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.9230769230769231
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.9230769230769231
name: Dot Mrr 1
- type: dot_map_60
value: 0.46604758240291716
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms uk matryoshka dim 128 '
type: jargonisms-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8717948717948718
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8717948717948718
name: Dot Precision 1
- type: dot_recall_1
value: 0.11476399162325937
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8717948717948718
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8717948717948718
name: Dot Mrr 1
- type: dot_map_60
value: 0.4561126872165208
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'jargonisms ru matryoshka dim 128 '
type: jargonisms-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8974358974358975
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8974358974358975
name: Dot Precision 1
- type: dot_recall_1
value: 0.1275845044437722
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8974358974358975
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8974358974358975
name: Dot Mrr 1
- type: dot_map_60
value: 0.4644866652607183
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa uk matryoshka dim 128 '
type: vespa-uk--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8369565217391305
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8369565217391305
name: Dot Precision 1
- type: dot_recall_1
value: 0.06600132988758785
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8369565217391305
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8369565217391305
name: Dot Mrr 1
- type: dot_map_60
value: 0.5618114046393388
name: Dot Map 60
- task:
type: rztkinformation-retrieval
name: RZTKInformation Retrieval
dataset:
name: 'vespa ru matryoshka dim 128 '
type: vespa-ru--matryoshka_dim-128--
metrics:
- type: dot_accuracy_1
value: 0.8260869565217391
name: Dot Accuracy 1
- type: dot_precision_1
value: 0.8260869565217391
name: Dot Precision 1
- type: dot_recall_1
value: 0.06020422843831247
name: Dot Recall 1
- type: dot_ndcg_1
value: 0.8260869565217391
name: Dot Ndcg 1
- type: dot_mrr_1
value: 0.8260869565217391
name: Dot Mrr 1
- type: dot_map_60
value: 0.5530272686449091
name: Dot Map 60
- task:
type: sequential
name: Sequential
dataset:
name: full benchmark
type: full-benchmark
metrics:
- type: avg--matryoshka_dim-768--_dot_accuracy_1
value: 0.8475126368866295
name: Avg--Matryoshka Dim-768-- Dot Accuracy 1
- type: avg--matryoshka_dim-768--_dot_precision_1
value: 0.8475126368866295
name: Avg--Matryoshka Dim-768-- Dot Precision 1
- type: avg--matryoshka_dim-768--_dot_recall_1
value: 0.12663801183267726
name: Avg--Matryoshka Dim-768-- Dot Recall 1
- type: avg--matryoshka_dim-768--_dot_ndcg_1
value: 0.8475126368866295
name: Avg--Matryoshka Dim-768-- Dot Ndcg 1
- type: avg--matryoshka_dim-768--_dot_mrr_1
value: 0.8475126368866295
name: Avg--Matryoshka Dim-768-- Dot Mrr 1
- type: avg--matryoshka_dim-768--_dot_map_60
value: 0.4515039806755055
name: Avg--Matryoshka Dim-768-- Dot Map 60
- type: avg--matryoshka_dim-512--_dot_accuracy_1
value: 0.8411088714051607
name: Avg--Matryoshka Dim-512-- Dot Accuracy 1
- type: avg--matryoshka_dim-512--_dot_precision_1
value: 0.8411088714051607
name: Avg--Matryoshka Dim-512-- Dot Precision 1
- type: avg--matryoshka_dim-512--_dot_recall_1
value: 0.12570566135441796
name: Avg--Matryoshka Dim-512-- Dot Recall 1
- type: avg--matryoshka_dim-512--_dot_ndcg_1
value: 0.8411088714051607
name: Avg--Matryoshka Dim-512-- Dot Ndcg 1
- type: avg--matryoshka_dim-512--_dot_mrr_1
value: 0.8411088714051607
name: Avg--Matryoshka Dim-512-- Dot Mrr 1
- type: avg--matryoshka_dim-512--_dot_map_60
value: 0.44958447490300635
name: Avg--Matryoshka Dim-512-- Dot Map 60
- type: avg--matryoshka_dim-256--_dot_accuracy_1
value: 0.8363927930814402
name: Avg--Matryoshka Dim-256-- Dot Accuracy 1
- type: avg--matryoshka_dim-256--_dot_precision_1
value: 0.8363927930814402
name: Avg--Matryoshka Dim-256-- Dot Precision 1
- type: avg--matryoshka_dim-256--_dot_recall_1
value: 0.12576507898565795
name: Avg--Matryoshka Dim-256-- Dot Recall 1
- type: avg--matryoshka_dim-256--_dot_ndcg_1
value: 0.8363927930814402
name: Avg--Matryoshka Dim-256-- Dot Ndcg 1
- type: avg--matryoshka_dim-256--_dot_mrr_1
value: 0.8363927930814402
name: Avg--Matryoshka Dim-256-- Dot Mrr 1
- type: avg--matryoshka_dim-256--_dot_map_60
value: 0.44546663282771615
name: Avg--Matryoshka Dim-256-- Dot Map 60
- type: avg--matryoshka_dim-128--_dot_accuracy_1
value: 0.8104317432840267
name: Avg--Matryoshka Dim-128-- Dot Accuracy 1
- type: avg--matryoshka_dim-128--_dot_precision_1
value: 0.8104317432840267
name: Avg--Matryoshka Dim-128-- Dot Precision 1
- type: avg--matryoshka_dim-128--_dot_recall_1
value: 0.12091514974393017
name: Avg--Matryoshka Dim-128-- Dot Recall 1
- type: avg--matryoshka_dim-128--_dot_ndcg_1
value: 0.8104317432840267
name: Avg--Matryoshka Dim-128-- Dot Ndcg 1
- type: avg--matryoshka_dim-128--_dot_mrr_1
value: 0.8104317432840267
name: Avg--Matryoshka Dim-128-- Dot Mrr 1
- type: avg--matryoshka_dim-128--_dot_map_60
value: 0.4351438333410615
name: Avg--Matryoshka Dim-128-- Dot Map 60
---
# SentenceTransformer based on intfloat/multilingual-e5-base
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) on the core, typos, transliterations, rusisms and jargonisms datasets. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base)
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Dot Product
- **Training Datasets:**
- core
- typos
- transliterations
- rusisms
- jargonisms
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
RZTKSentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("yklymchuk-rztk/multiple-datasets-e5-jina-mnr-1-resume")
# Run inference
sentences = [
'query: чоловічіпіжами',
'passage: Пижамные штаны мужские Vienetta XL синий 311236 Мужские пижамы Vienetta',
'passage: Зарядная станция EcoFlow DELTA 2 (ZMR330-EU) Зарядные станции EcoFlow Тип аккумуляторов Литий-железо-фосфатные (LiFePO4) Назначение Для всего дома Особенности Быстрая зарядка батареи Страна-производитель товара Китай Выходные интерфейсы USB Type A Выходные интерфейсы USB Type C Емкость зарядной станции, Вт*ч 1024 Выходная мощность (общая), Вт 1800 Максимальная мощность устройств, Вт 2400 Тип (версия) розеток Европейская Количество портов USB Type A 2 Количество портов USB Type С 2 Количество розеток 4',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
## Evaluation
### Metrics
#### RZTKInformation Retrieval
* Datasets: `core-uk`, `core-ru`, `typos-uk`, `typos-ru`, `transliterations-uk`, `transliterations-ru`, `options-uk`, `options-ru`, `rusisms-uk`, `rusisms-ru`, `jargonisms-uk`, `jargonisms-ru`, `vespa-uk` and `vespa-ru`
* Evaluated with sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator
| Metric | core-uk | core-ru | typos-uk | typos-ru | transliterations-uk | transliterations-ru | options-uk | options-ru | rusisms-uk | rusisms-ru | jargonisms-uk | jargonisms-ru | vespa-uk | vespa-ru |
|:-----------------|:-----------|:-----------|:-----------|:-----------|:--------------------|:--------------------|:-----------|:-----------|:-----------|:-----------|:--------------|:--------------|:-----------|:-----------|
| dot_accuracy_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 |
| dot_accuracy_3 | 0.9475 | 0.9462 | 0.9265 | 0.9199 | 0.8483 | 0.8526 | 0.949 | 0.9515 | 0.989 | 0.967 | 0.9487 | 0.9487 | 0.9022 | 0.8913 |
| dot_accuracy_5 | 0.9764 | 0.9803 | 0.9606 | 0.9633 | 0.8744 | 0.8785 | 0.9782 | 0.9806 | 0.989 | 0.989 | 0.9744 | 0.9744 | 0.913 | 0.8913 |
| dot_accuracy_10 | 0.9974 | 0.9987 | 0.9882 | 0.9895 | 0.9054 | 0.908 | 1.0 | 1.0 | 1.0 | 1.0 | 0.9744 | 0.9744 | 0.9239 | 0.9022 |
| dot_precision_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 |
| dot_precision_3 | 0.7559 | 0.7528 | 0.731 | 0.727 | 0.5065 | 0.5123 | 0.7718 | 0.7783 | 0.8974 | 0.8901 | 0.8034 | 0.7949 | 0.8043 | 0.8007 |
| dot_precision_5 | 0.6664 | 0.6669 | 0.6436 | 0.6396 | 0.3891 | 0.3932 | 0.6063 | 0.6087 | 0.844 | 0.8352 | 0.7641 | 0.759 | 0.7717 | 0.7543 |
| dot_precision_10 | 0.4056 | 0.4054 | 0.3959 | 0.3949 | 0.2199 | 0.2215 | 0.342 | 0.3427 | 0.7341 | 0.7308 | 0.641 | 0.6385 | 0.6837 | 0.6804 |
| dot_recall_1 | 0.1294 | 0.1298 | 0.1215 | 0.1218 | 0.2328 | 0.2368 | 0.131 | 0.1317 | 0.0871 | 0.0868 | 0.1166 | 0.1166 | 0.0688 | 0.0622 |
| dot_recall_3 | 0.3005 | 0.301 | 0.2901 | 0.2883 | 0.342 | 0.3456 | 0.3431 | 0.345 | 0.1999 | 0.1967 | 0.2326 | 0.2307 | 0.141 | 0.1353 |
| dot_recall_5 | 0.4112 | 0.4129 | 0.3967 | 0.3953 | 0.3909 | 0.3944 | 0.438 | 0.4392 | 0.2688 | 0.2651 | 0.3197 | 0.3171 | 0.184 | 0.1739 |
| dot_recall_10 | 0.4831 | 0.4833 | 0.4716 | 0.4706 | 0.4211 | 0.4238 | 0.4892 | 0.4902 | 0.3833 | 0.3799 | 0.4288 | 0.4275 | 0.2387 | 0.2305 |
| **dot_ndcg_10** | **0.5995** | **0.5999** | **0.5811** | **0.5799** | **0.509** | **0.5144** | **0.5858** | **0.5877** | **0.8346** | **0.8299** | **0.7774** | **0.7743** | **0.7717** | **0.7605** |
| dot_mrr_10 | 0.8935 | 0.8958 | 0.8659 | 0.8671 | 0.8127 | 0.8217 | 0.9013 | 0.9059 | 0.9634 | 0.9569 | 0.9239 | 0.9239 | 0.8856 | 0.8641 |
| dot_map_60 | 0.4286 | 0.4288 | 0.414 | 0.4132 | 0.3886 | 0.3939 | 0.4269 | 0.4279 | 0.4774 | 0.4742 | 0.4557 | 0.4535 | 0.5732 | 0.5652 |
#### RZTKInformation Retrieval
* Datasets: `core-uk--matryoshka_dim-768--`, `core-ru--matryoshka_dim-768--`, `typos-uk--matryoshka_dim-768--`, `typos-ru--matryoshka_dim-768--`, `transliterations-uk--matryoshka_dim-768--`, `transliterations-ru--matryoshka_dim-768--`, `options-uk--matryoshka_dim-768--`, `options-ru--matryoshka_dim-768--`, `rusisms-uk--matryoshka_dim-768--`, `rusisms-ru--matryoshka_dim-768--`, `jargonisms-uk--matryoshka_dim-768--`, `jargonisms-ru--matryoshka_dim-768--`, `vespa-uk--matryoshka_dim-768--`, `vespa-ru--matryoshka_dim-768--`, `core-uk--matryoshka_dim-512--`, `core-ru--matryoshka_dim-512--`, `typos-uk--matryoshka_dim-512--`, `typos-ru--matryoshka_dim-512--`, `transliterations-uk--matryoshka_dim-512--`, `transliterations-ru--matryoshka_dim-512--`, `options-uk--matryoshka_dim-512--`, `options-ru--matryoshka_dim-512--`, `rusisms-uk--matryoshka_dim-512--`, `rusisms-ru--matryoshka_dim-512--`, `jargonisms-uk--matryoshka_dim-512--`, `jargonisms-ru--matryoshka_dim-512--`, `vespa-uk--matryoshka_dim-512--`, `vespa-ru--matryoshka_dim-512--`, `core-uk--matryoshka_dim-256--`, `core-ru--matryoshka_dim-256--`, `typos-uk--matryoshka_dim-256--`, `typos-ru--matryoshka_dim-256--`, `transliterations-uk--matryoshka_dim-256--`, `transliterations-ru--matryoshka_dim-256--`, `options-uk--matryoshka_dim-256--`, `options-ru--matryoshka_dim-256--`, `rusisms-uk--matryoshka_dim-256--`, `rusisms-ru--matryoshka_dim-256--`, `jargonisms-uk--matryoshka_dim-256--`, `jargonisms-ru--matryoshka_dim-256--`, `vespa-uk--matryoshka_dim-256--`, `vespa-ru--matryoshka_dim-256--`, `core-uk--matryoshka_dim-128--`, `core-ru--matryoshka_dim-128--`, `typos-uk--matryoshka_dim-128--`, `typos-ru--matryoshka_dim-128--`, `transliterations-uk--matryoshka_dim-128--`, `transliterations-ru--matryoshka_dim-128--`, `options-uk--matryoshka_dim-128--`, `options-ru--matryoshka_dim-128--`, `rusisms-uk--matryoshka_dim-128--`, `rusisms-ru--matryoshka_dim-128--`, `jargonisms-uk--matryoshka_dim-128--`, `jargonisms-ru--matryoshka_dim-128--`, `vespa-uk--matryoshka_dim-128--` and `vespa-ru--matryoshka_dim-128--`
* Evaluated with sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator
| Metric | core-uk--matryoshka_dim-768-- | core-ru--matryoshka_dim-768-- | typos-uk--matryoshka_dim-768-- | typos-ru--matryoshka_dim-768-- | transliterations-uk--matryoshka_dim-768-- | transliterations-ru--matryoshka_dim-768-- | options-uk--matryoshka_dim-768-- | options-ru--matryoshka_dim-768-- | rusisms-uk--matryoshka_dim-768-- | rusisms-ru--matryoshka_dim-768-- | jargonisms-uk--matryoshka_dim-768-- | jargonisms-ru--matryoshka_dim-768-- | vespa-uk--matryoshka_dim-768-- | vespa-ru--matryoshka_dim-768-- | core-uk--matryoshka_dim-512-- | core-ru--matryoshka_dim-512-- | typos-uk--matryoshka_dim-512-- | typos-ru--matryoshka_dim-512-- | transliterations-uk--matryoshka_dim-512-- | transliterations-ru--matryoshka_dim-512-- | options-uk--matryoshka_dim-512-- | options-ru--matryoshka_dim-512-- | rusisms-uk--matryoshka_dim-512-- | rusisms-ru--matryoshka_dim-512-- | jargonisms-uk--matryoshka_dim-512-- | jargonisms-ru--matryoshka_dim-512-- | vespa-uk--matryoshka_dim-512-- | vespa-ru--matryoshka_dim-512-- | core-uk--matryoshka_dim-256-- | core-ru--matryoshka_dim-256-- | typos-uk--matryoshka_dim-256-- | typos-ru--matryoshka_dim-256-- | transliterations-uk--matryoshka_dim-256-- | transliterations-ru--matryoshka_dim-256-- | options-uk--matryoshka_dim-256-- | options-ru--matryoshka_dim-256-- | rusisms-uk--matryoshka_dim-256-- | rusisms-ru--matryoshka_dim-256-- | jargonisms-uk--matryoshka_dim-256-- | jargonisms-ru--matryoshka_dim-256-- | vespa-uk--matryoshka_dim-256-- | vespa-ru--matryoshka_dim-256-- | core-uk--matryoshka_dim-128-- | core-ru--matryoshka_dim-128-- | typos-uk--matryoshka_dim-128-- | typos-ru--matryoshka_dim-128-- | transliterations-uk--matryoshka_dim-128-- | transliterations-ru--matryoshka_dim-128-- | options-uk--matryoshka_dim-128-- | options-ru--matryoshka_dim-128-- | rusisms-uk--matryoshka_dim-128-- | rusisms-ru--matryoshka_dim-128-- | jargonisms-uk--matryoshka_dim-128-- | jargonisms-ru--matryoshka_dim-128-- | vespa-uk--matryoshka_dim-128-- | vespa-ru--matryoshka_dim-128-- |
|:----------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|
| dot_accuracy_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 |
| dot_precision_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 |
| dot_recall_1 | 0.1294 | 0.1298 | 0.1215 | 0.1218 | 0.2328 | 0.2368 | 0.131 | 0.1317 | 0.0871 | 0.0868 | 0.1166 | 0.1166 | 0.0688 | 0.0622 | 0.1292 | 0.1284 | 0.1205 | 0.1192 | 0.2292 | 0.2339 | 0.1304 | 0.1305 | 0.0871 | 0.0871 | 0.1166 | 0.1166 | 0.0683 | 0.0629 | 0.1279 | 0.1277 | 0.1204 | 0.1188 | 0.2227 | 0.2265 | 0.1306 | 0.1302 | 0.0879 | 0.0866 | 0.1166 | 0.1294 | 0.0732 | 0.062 | 0.1259 | 0.123 | 0.1159 | 0.1145 | 0.2076 | 0.2124 | 0.1264 | 0.1271 | 0.0849 | 0.0865 | 0.1148 | 0.1276 | 0.066 | 0.0602 |
| **dot_ndcg_1** | **0.832** | **0.8346** | **0.7927** | **0.7966** | **0.7662** | **0.7794** | **0.8447** | **0.8495** | **0.9341** | **0.9341** | **0.8974** | **0.8974** | **0.8696** | **0.837** | **0.8215** | **0.8189** | **0.7795** | **0.7782** | **0.7516** | **0.7655** | **0.8398** | **0.8398** | **0.9451** | **0.9451** | **0.8974** | **0.8974** | **0.8478** | **0.8478** | **0.8123** | **0.8123** | **0.7822** | **0.7743** | **0.7225** | **0.7334** | **0.8398** | **0.8374** | **0.9451** | **0.9341** | **0.8974** | **0.9231** | **0.8587** | **0.837** | **0.7979** | **0.7835** | **0.7546** | **0.7598** | **0.6654** | **0.6778** | **0.8107** | **0.818** | **0.9231** | **0.9231** | **0.8718** | **0.8974** | **0.837** | **0.8261** |
| dot_mrr_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 |
| dot_map_60 | 0.4286 | 0.4288 | 0.414 | 0.4132 | 0.3886 | 0.3939 | 0.4269 | 0.4279 | 0.4774 | 0.4742 | 0.4557 | 0.4535 | 0.5732 | 0.5652 | 0.4276 | 0.4274 | 0.4104 | 0.4093 | 0.3818 | 0.3871 | 0.4263 | 0.4269 | 0.4762 | 0.4749 | 0.4553 | 0.4537 | 0.5732 | 0.564 | 0.4232 | 0.4233 | 0.4048 | 0.4039 | 0.3654 | 0.3708 | 0.4211 | 0.4213 | 0.4736 | 0.4732 | 0.4578 | 0.4655 | 0.5722 | 0.5606 | 0.4161 | 0.4148 | 0.3941 | 0.3945 | 0.3379 | 0.3443 | 0.4112 | 0.4107 | 0.4669 | 0.466 | 0.4561 | 0.4645 | 0.5618 | 0.553 |
#### Sequential
* Dataset: `full-benchmark`
* Evaluated with [SequentialEvaluator
](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.SequentialEvaluator)
| Metric | Value |
|:------------------------------------------|:-------|
| avg--matryoshka_dim-768--_dot_accuracy_1 | 0.8475 |
| avg--matryoshka_dim-768--_dot_precision_1 | 0.8475 |
| avg--matryoshka_dim-768--_dot_recall_1 | 0.1266 |
| avg--matryoshka_dim-768--_dot_ndcg_1 | 0.8475 |
| avg--matryoshka_dim-768--_dot_mrr_1 | 0.8475 |
| avg--matryoshka_dim-768--_dot_map_60 | 0.4515 |
| avg--matryoshka_dim-512--_dot_accuracy_1 | 0.8411 |
| avg--matryoshka_dim-512--_dot_precision_1 | 0.8411 |
| avg--matryoshka_dim-512--_dot_recall_1 | 0.1257 |
| avg--matryoshka_dim-512--_dot_ndcg_1 | 0.8411 |
| avg--matryoshka_dim-512--_dot_mrr_1 | 0.8411 |
| avg--matryoshka_dim-512--_dot_map_60 | 0.4496 |
| avg--matryoshka_dim-256--_dot_accuracy_1 | 0.8364 |
| avg--matryoshka_dim-256--_dot_precision_1 | 0.8364 |
| avg--matryoshka_dim-256--_dot_recall_1 | 0.1258 |
| avg--matryoshka_dim-256--_dot_ndcg_1 | 0.8364 |
| avg--matryoshka_dim-256--_dot_mrr_1 | 0.8364 |
| avg--matryoshka_dim-256--_dot_map_60 | 0.4455 |
| avg--matryoshka_dim-128--_dot_accuracy_1 | 0.8104 |
| avg--matryoshka_dim-128--_dot_precision_1 | 0.8104 |
| avg--matryoshka_dim-128--_dot_recall_1 | 0.1209 |
| avg--matryoshka_dim-128--_dot_ndcg_1 | 0.8104 |
| avg--matryoshka_dim-128--_dot_mrr_1 | 0.8104 |
| avg--matryoshka_dim-128--_dot_map_60 | 0.4351 |
## Training Details
### Training Datasets
#### core
* Dataset: core
* Size: 39,853,448 training samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details |
query: campingaz fold n cool classic 10l dark blue
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає
|
| query: campingaz 10
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає
|
| query: campingaz fold n cool classic 10l dark blue
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукция Campingaz Гарантия 14 дней Вид Термосумки Цвет Синий с белым Режим работы Охлаждение Страна регистрации бренда Франция Страна-производитель товара Китай Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Нет
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### typos
* Dataset: typos
* Size: 11,780,774 training samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: єлектрорадимтор
| passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий
|
| query: електрордиатор теплотер
| passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий
|
| query: электрически ракдиатор
| passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### transliterations
* Dataset: transliterations
* Size: 14,660,140 training samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: campingaz fold n cool classic 10l дарк blue
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає
|
| query: campingaz fold n cool classic 10l дорк blue
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає
|
| query: campingaz fold n кул classic 10l dark blue
| passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### rusisms
* Dataset: rusisms
* Size: 11,205,398 training samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: насос вібраціоныі̆ шланг
| passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав
|
| query: насос вібраціониі̆ шланг
| passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав
|
| query: насос погружной ніжні̆ забор
| passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### jargonisms
* Dataset: jargonisms
* Size: 2,873,842 training samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: кроси для баскетболу дитячі
| passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33
|
| query: кроси для баскетболу
| passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33
|
| query: баскетбольні кроси дитячі 10 років
| passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
### Evaluation Datasets
#### core_uk
* Dataset: core_uk
* Size: 3,220 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: лампочка е27
| passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA
|
| query: лампочка е27
| passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA
|
| query: лампочка е27
| passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### core_ru
* Dataset: core_ru
* Size: 3,220 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: лампочка е27
| passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA
|
| query: лампочка е27
| passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA
|
| query: лампочка е27
| passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### typos_uk
* Dataset: typos_uk
* Size: 3,220 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: лампочка е7
| passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA
|
| query: лампочка е7
| passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA
|
| query: лампочка е7
| passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### typos_ru
* Dataset: typos_ru
* Size: 3,220 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: лампочка е7
| passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA
|
| query: лампочка е7
| passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA
|
| query: лампочка е7
| passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### transliterations_uk
* Dataset: transliterations_uk
* Size: 13,144 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: апиэу
| passage: Зволожувальний лактокрем для обличчя A'pieu Lactobacillus 50 мл (8809643517201) Крем для обличчя A'pieu Клас косметики Мідл-маркет Час застосування Ніч Вік Від 18 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 50 мл Вид Крем Сфера застосування Обличчя Тип шкіри Суха Тип шкіри Нормальна Призначення Відновлююче Призначення Зволожувальне Доставка Доставка в магазини ROZETKA
|
| query: апиэу
| passage: Тональний засіб A'pieu Клас косметики Мідл-маркет
|
| query: апиэу
| passage: Емульсія мінеральна A'pieu Aqua Marine 180 мл (8809530043608) Засіб для вмивання A'pieu Клас косметики Натуральна Час застосування Універсально Вік Від 20 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Серія Aqua Marine Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 180 мл Вид Емульсія Дія Тонізує Дія Зволожує Дія Очищає Тип шкіри Для всіх типів Призначення Зволожувальне Тип гарантійного талона Без гарантійного талона Можливість доставки Почтомати
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### transliterations_ru
* Dataset: transliterations_ru
* Size: 13,144 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: апиэу
| passage: Увлажняющий лакто-крем для лица A'pieu Lactobacillus 50 мл (8809643517201) Крем для лица A'pieu Класс косметики Миддл-маркет Время применения Ночь Возраст От 18 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Страна-производитель товара Республика Корея (Южная Корея) Объем 50 мл Вид Крем Область применения Лицо Тип кожи Сухая Тип кожи Нормальная Назначение Восстанавливающее Назначение Увлажняющее Доставка Доставка в магазины ROZETKA
|
| query: апиэу
| passage: Воздушный хлопковый кушон с матовым финишем. Air-Fit A'pieu Cushion PPOSONG SPF50+/PA+++ 13,5g A'pieu Тональное средство A'pieu Класс косметики Миддл-маркет
|
| query: апиэу
| passage: Эмульсия минеральная A'pieu Aqua Marine 180 мл (8809530043608) Средство для умывания A'pieu Класс косметики Натуральная Время применения Универсально Возраст От 20 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Серия Aqua Marine Страна-производитель товара Республика Корея (Южная Корея) Объем 180 мл Вид Эмульсия Действие Тонизирует Действие Увлажняет Действие Очищает Тип кожи Для всех типов Назначение Увлажняющее Тип гарантийного талона Без гарантийного талона Возможность доставки Почтоматы
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### options_uk
* Dataset: options_uk
* Size: 1,442 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: спортивные шорты женские
| passage: Спортивні шорти жіночі Traum 2410-17 M (44-46) Чорні (4820024101721) Жіночі спортивні шорти Traum Сезон Осінній Сезон Літній Сезон Весняний Сезон Демісезонний Кількість вантажних місць 1 Довжина Коротка Країна реєстрації бренда Україна Країна-виробник товару Україна Декор З лампасами Розмір 46 Розмір 44 Стиль Спортивний Колір Чорний Матеріал Трикотаж Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA
|
| query: спортивные шорты женские
| passage: Спортивні шорти жіночі ISSA PLUS 11377 S Чорні (issa2000239538884) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір S Стиль Спортивний Колір Чорний Матеріал Поліестер Матеріал Поліамід Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Доставка Доставка в магазини ROZETKA
|
| query: спортивные шорты женские
| passage: Спортивні шорти жіночі ISSA PLUS 7770 L Чорні (issa2000260293349) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Довжина Подовжена Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір L Стиль Спортивний Колір Чорний Матеріал Поліестер Тип гарантійного талона Гарантія по чеку Доставка Premium Принт Напис Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### options_ru
* Dataset: options_ru
* Size: 1,442 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: спортивные шорты женские
| passage: Спортивные шорты женские Traum 2410-17 M (44-46) Черные (4820024101721) Женские спортивные шорты Traum Сезон Осенний Сезон Летний Сезон Весенний Сезон Демисезонный Количество грузовых мест 1 Длина Короткая Страна регистрации бренда Украина Страна-производитель товара Украина Декор С лампасами Размер 46 Размер 44 Стиль Спортивный Цвет Черный Материал Трикотаж Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA
|
| query: спортивные шорты женские
| passage: Спортивные шорты женские ISSA PLUS 11377 S Черные (issa2000239538884) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Украина Размер S Стиль Спортивный Цвет Черный Материал Полиэстер Материал Полиамид Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Доставка Доставка в магазины ROZETKA
|
| query: спортивные шорты женские
| passage: Спортивные шорты женские ISSA PLUS 7770 L Черные (issa2000260293349) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Длина Удлинённая Страна регистрации бренда Украина Страна-производитель товара Украина Размер L Стиль Спортивный Цвет Черный Материал Полиэстер Тип гарантийного талона Гарантия по чеку Доставка Premium Принт Надпись Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### rusisms_uk
* Dataset: rusisms_uk
* Size: 1,061 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: блок безперебійного пітанія
| passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Джерела безперебійного живлення LogicPower Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 10 ТЕГИ У кредит
|
| query: блок безперебійного пітанія
| passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 20 ТЕГИ У кредит
|
| query: блок безперебійного пітанія
| passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Особливості З дисплеєм Час роботи за повного навантаження, хв 8 ТЕГИ У кредит Доставка Доставка в магазини ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### rusisms_ru
* Dataset: rusisms_ru
* Size: 1,061 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: блок безперебійного пітанія
| passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Источники бесперебойного питания LogicPower Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 10 ТЕГИ В кредит
|
| query: блок безперебійного пітанія
| passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 20 ТЕГИ В кредит
|
| query: блок безперебійного пітанія
| passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Особенности С дисплеем Время работы при полной нагрузке, мин 8 ТЕГИ В кредит Доставка Доставка в магазины ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### jargonisms_uk
* Dataset: jargonisms_uk
* Size: 338 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 338 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: сумка для лептопа
| passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки та чохли для ноутбуків 2E Гарантія 14 днів Діагональ ноутбука 15.6"-16" Матеріал Нейлон Колір Grey Тип Сумка Спосіб закриття Змійка Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Китай Діагональ сумки/рюкзака 15.6" Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Особливості Відділення для аксесуарів
|
| query: аккумуляторка
| passage: Акумуляторна ланцюгова пила Greenworks G24CS25 (2000007) Акумуляторні пилки Greenworks Гарантія 36 місяців Кількість вантажних місць 1 Країна реєстрації бренда США Країна-виробник товару Китай Теги недорогі Теги туристичні Теги професійні Для прив'язки тегів Неймовірно тихий Для прив'язки тегів Потужний двигун Для прив'язки тегів Швидкий запуск Довжина шини, мм 250 Особливості Автоматичне змащування ланцюга Особливості Блокування кнопки увімкнення Вага, кг 2.7 Розташування двигуна в пилі Поперечний (бічний) Швидкість обертання ланцюга, м/сек 4.2 Тип гарантійного талона Гарантійний талон магазина Доставка Premium Напруга акумулятора, В 24 Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA
|
| query: аккумуляторка
| passage: Акумуляторна ланцюгова пила Stark BCS-3610 (310100101) Акумуляторні пилки Stark Гарантія 12 місяців Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Країна-виробник товару Китай Теги недорогі Теги туристичні Довжина шини, мм 250 Особливості SDS система Особливості Гальмо ланцюга Особливості Блокування кнопки увімкнення Особливості Легкий запуск Особливості Автоматичне змащування ланцюга Вага, кг 3.2 Розташування двигуна в пилі Поперечний (бічний) Тип гарантійного талона Гарантійний талон магазина Тип двигуна Безщітковий Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### jargonisms_ru
* Dataset: jargonisms_ru
* Size: 338 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 338 samples:
| | query | text |
|:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
| type | string | string |
| details | query: сумка для лептопа
| passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки и чехлы для ноутбуков 2E Гарантия 14 дней Диагональ ноутбука 15.6"-16" Материал Нейлон Цвет Grey Тип Сумка Способ закрытия Молния Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Китай Диагональ сумки/рюкзака 15.6" Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Особенности Отделение для аксессуаров
|
| query: аккумуляторка
| passage: Аккумуляторная цепная пила Greenworks G24CS25 (2000007) Аккумуляторные пилы Greenworks Гарантия 36 месяцев Количество грузовых мест 1 Страна регистрации бренда США Страна-производитель товара Китай Теги недорогие Теги туристические Теги профессиональные Для привязки тегов Невероятно тихий Для привязки тегов Мощный двигатель Для привязки тегов Быстрый запуск Длина шины, мм 250 Особенности Автоматическая смазка цепи Особенности Блокировка кнопки включения Вес, кг 2.7 Расположение двигателя в пиле Поперечное (боковое) Скорость вращения цепи, м/сек 4.2 Тип гарантийного талона Гарантийный талон магазина Доставка Premium Напряжение аккумулятора, В 24 Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA
|
| query: аккумуляторка
| passage: Аккумуляторная цепная пила Stark BCS-3610 (310100101) Аккумуляторные пилы Stark Гарантия 12 месяцев Количество грузовых мест 1 Страна регистрации бренда Германия Страна-производитель товара Китай Теги недорогие Теги туристические Длина шины, мм 250 Особенности SDS система Особенности Тормоз цепи Особенности Блокировка кнопки включения Особенности Легкий запуск Особенности Автоматическая смазка цепи Вес, кг 3.2 Расположение двигателя в пиле Поперечное (боковое) Тип гарантийного талона Гарантийный талон магазина Тип двигателя Бесщеточный Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### vespa_uk
* Dataset: vespa_uk
* Size: 5,315 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:---------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
| type | string | string |
| details | query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: Перехідники для шлангу басейну Intex з 32 мм на 38 мм (IP-175136) Обладнання для басейнів Intex Вид Комплектувальні
|
| query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: З'єднання для шланга Peraqua діаметр 32 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів
|
| query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: З'єднання для шлангу Peraqua діаметр 32/38 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
#### vespa_ru
* Dataset: vespa_ru
* Size: 5,315 evaluation samples
* Columns: query
and text
* Approximate statistics based on the first 1000 samples:
| | query | text |
|:--------|:---------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
| type | string | string |
| details | query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: Переходники для шланга бассейна Intex с 32 мм на 38 мм (IP-175136) Оборудование для бассейнов Intex Вид Комплектующие
|
| query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: Соединение для шланга Peraqua диаметр 32 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов
|
| query: шланга диаметром 32 мм для викачки брудної води з басейну
| passage: Соединение для шланга Peraqua диаметр 32/38 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов
|
* Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss
with these parameters:
```json
{
"loss": "RZTKMultipleNegativesRankingLoss",
"n_layers_per_step": 1,
"last_layer_weight": 1.0,
"prior_layers_weight": 1.0,
"kl_div_weight": 1.0,
"kl_temperature": 0.3,
"matryoshka_dims": [
768,
512,
256,
128
],
"matryoshka_weights": [
1,
1,
1,
1
],
"n_dims_per_step": 1
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 80
- `per_device_eval_batch_size`: 16
- `learning_rate`: 2e-05
- `num_train_epochs`: 1.0
- `warmup_ratio`: 0.1
- `bf16`: True
- `bf16_full_eval`: True
- `tf32`: True
- `dataloader_num_workers`: 4
- `load_best_model_at_end`: True
- `optim`: adafactor
- `push_to_hub`: True
- `hub_model_id`: yklymchuk-rztk/multiple-datasets-e5-jina-mnr-1-resume
- `hub_private_repo`: True
- `prompts`: {'query': 'query: ', 'text': 'passage: '}
- `batch_sampler`: no_duplicates
#### All Hyperparameters