--- tags: - sentence-transformers - sentence-similarity - feature-extraction - generated_from_trainer - dataset_size:80373602 - loss:RZTKMatryoshka2dLoss base_model: intfloat/multilingual-e5-base widget: - source_sentence: 'query: опдушка масажер' sentences: - 'passage: Обкладинка для зошитів ZiBi А5+ 100мкм прозора (ZB.4704) Обкладинки для зошитів і підручників ZiBi Колір Прозорий Тип Обкладинки Вид Для зошитів' - 'passage: Газова варильна панель ELEGANT GH 2100 Варильні поверхні газові Elegant Гарантія 12 місяців Кількість конфорок 2 Керування Поворотні перемикачі Матеріал поверхні Загартоване скло Вид поверхні Domino Розташування панелі керування Фронтальне Матеріал решіток Чавун Тип електрозапалювання Автоматичний (у ручці) Тип використовуваного газу Природний газ Тип використовуваного газу Бутан/зріджений Колір Чорний Країна-виробник товару Китай' - 'passage: Масажна подушка Magic Massager Pillow 8028 для будинку і машини Масажери Magic Вид масажера Масажний пояс Вид масажера Масажна подушка Вид масажера Масажна підставка Вид масажера Масажний комір Живлення Мережа Живлення Прикурювач теги домашні теги електричні' - source_sentence: 'query: смєсітель для раковини' sentences: - 'passage: Електрична щітка для прибирання Magic Brush 5в1 Віники та щітки Magic Brush Гарантія 14 днів Країна-виробник товару Китай Матеріал Пластик Колір Білий Тип Щітки Вид Електричні Призначення Універсальні Призначення Для чищення кухні Призначення Для чищення ванної' - 'passage: Машинка для видалення катишек від мережі 220в 5вт Lint Remover UKC YX 5880 Біло-синя Машинки для відстригання ковтунців UKC Країна реєстрації бренда Китай Комплектація Захисна кришка для лез Колір Білий / Блакитний Доставка Доставка в магазини ROZETKA' - 'passage: Змішувач-кран для раковини TAU SM-2A144C Змішувачі для раковини Tau Гарантія 12 місяців офіційної гарантії від виробника Тип виливу Стаціонарний Вид монтажу Врізний Вид змішувача Одноважільний Спосіб монтажу На 1 отвір Термостат Немає Матеріал Силумін Колір Хром Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Китай Шланги під''єднання Входять до комплекту постачання Діаметр під''єднання шлангів 1/2" Шланги На різьбі Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Доставка в магазини ROZETKA' - source_sentence: 'query: эхилс' sentences: - 'passage: Пульсоксиметр AHealth AH OXI100 Black (EP805178) - Уценка Уцененная мелкая бытовая техника Ahealth Гарантия 14 дней Количество грузовых мест 1 Страна регистрации бренда Китай Страна-производитель товара Китай Тип гарантийного талона Гарантийный талон магазина' - 'passage: Пильное полотно для сабельной пилы DeWalt Alligator 275 мм (DT2963) Пильные полотна Stanley Рабочая длина 275 мм Тип реза Прямой Вид Полотна Страна регистрации бренда США Количество предметов, шт 1 Страна-производитель товара Чехия теги пильное полотно для сабельной пилы теги пильное полотно универсальное' - 'passage: Коляска прогулочная BabyHit Nano Denim (23_299) Детские коляски BabyHit Гарантия 6 месяцев Тип Прогулочные Ремни безопасности 5-ти точечные Регулировка спинки Многопозиционная плавная регулировка Основной цвет Серый Пол ребенка Девочка Пол ребенка Мальчик Максимальный вес ребенка, кг 18 Поворотность колес Поворотные Количество грузовых мест 1 Вес коляски, кг 6.7 Страна регистрации бренда Украина Страна-производитель товара Китай теги летние теги лучшие теги складные теги зимние теги стильные теги недорого Тип гарантийного талона Оригинальный гарантийный талон Доставка Premium Тип колес Литые Конструкция Багажная корзина' - source_sentence: 'query: антена т2' sentences: - 'passage: Антенна комнатная Energy Феномен Т2 с усилителем (PH_T2_U) Антенны Energy Принимаемый сигнал Цифровой Стандарты цифрового ТВ DVB-T2 Тип Комнатные Страна регистрации бренда Украина Страна-производитель товара Германия' - 'passage: Мужские резиновые сапоги высокие Jose Amorales 118150 46 Хаки (2201181504600) Мужские резиновые сапоги Jose Amorales Цвет Зеленый Материал верха EVA (этиленвинилацетат) Материал подкладки EVA Материал подошвы EVA (этиленвинилацетат) Размер 46 Сезон Демисезонный Сезон Осенний Сезон Весенний Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Украина Назначение Для повседневной носки Назначение Для охоты Назначение Для рыбалки Высота изделия Высокие Застежка Без застежки Доставка Доставка в магазины ROZETKA' - 'passage: Рюкзак Cool For School 46х30х18 см 15 л (CF86258) Школьные рюкзаки и ранцы Cool For School Гарантия 14 дней Тип Рюкзаки Комплектация Ранец Цвет Розовый с салатовым Пол Для девочек Материал Полиэстер Вид Подростковые Размер (рост) L (145 - 175 см) Количество грузовых мест 1 Страна регистрации бренда Германия Страна-производитель товара Китай Вес, г 830 Тип гарантийного талона Гарантия по чеку Спинка Анатомическая Доставка Premium Доставка Доставка в магазины ROZETKA' - source_sentence: 'query: чоловічіпіжами' sentences: - 'passage: Пижамные штаны мужские Vienetta XL синий 311236 Мужские пижамы Vienetta' - 'passage: ИБП для роутера MARSRIVA KP7 UPS для роутеров 24000 mAh LiFePo4 100W DCx10/Gigabit PoE(24/48V) (KP7_MARSRIVA) Источники бесперебойного питания MARSRIVA Тип архитектуры Резервные (off-line) EAN 4897065473506 Страна-производитель товара Китай Аккумуляторная батарея Встроенная Номинальная мощность 100 Вт Особенности С дисплеем Назначение Для видеонаблюдения Назначение Для роутера Интерфейсы RJ-45 Тип монтажа Настольные/вертикальные (mini tower)' - 'passage: Зарядная станция EcoFlow DELTA 2 (ZMR330-EU) Зарядные станции EcoFlow Тип аккумуляторов Литий-железо-фосфатные (LiFePO4) Назначение Для всего дома Особенности Быстрая зарядка батареи Страна-производитель товара Китай Выходные интерфейсы USB Type A Выходные интерфейсы USB Type C Емкость зарядной станции, Вт*ч 1024 Выходная мощность (общая), Вт 1800 Максимальная мощность устройств, Вт 2400 Тип (версия) розеток Европейская Количество портов USB Type A 2 Количество портов USB Type С 2 Количество розеток 4' pipeline_tag: sentence-similarity library_name: sentence-transformers metrics: - dot_accuracy_1 - dot_accuracy_3 - dot_accuracy_5 - dot_accuracy_10 - dot_precision_1 - dot_precision_3 - dot_precision_5 - dot_precision_10 - dot_recall_1 - dot_recall_3 - dot_recall_5 - dot_recall_10 - dot_ndcg_10 - dot_mrr_10 - dot_map_60 - dot_ndcg_1 - dot_mrr_1 - avg--matryoshka_dim-768--_dot_accuracy_1 - avg--matryoshka_dim-768--_dot_precision_1 - avg--matryoshka_dim-768--_dot_recall_1 - avg--matryoshka_dim-768--_dot_ndcg_1 - avg--matryoshka_dim-768--_dot_mrr_1 - avg--matryoshka_dim-768--_dot_map_60 - avg--matryoshka_dim-512--_dot_accuracy_1 - avg--matryoshka_dim-512--_dot_precision_1 - avg--matryoshka_dim-512--_dot_recall_1 - avg--matryoshka_dim-512--_dot_ndcg_1 - avg--matryoshka_dim-512--_dot_mrr_1 - avg--matryoshka_dim-512--_dot_map_60 - avg--matryoshka_dim-256--_dot_accuracy_1 - avg--matryoshka_dim-256--_dot_precision_1 - avg--matryoshka_dim-256--_dot_recall_1 - avg--matryoshka_dim-256--_dot_ndcg_1 - avg--matryoshka_dim-256--_dot_mrr_1 - avg--matryoshka_dim-256--_dot_map_60 - avg--matryoshka_dim-128--_dot_accuracy_1 - avg--matryoshka_dim-128--_dot_precision_1 - avg--matryoshka_dim-128--_dot_recall_1 - avg--matryoshka_dim-128--_dot_ndcg_1 - avg--matryoshka_dim-128--_dot_mrr_1 - avg--matryoshka_dim-128--_dot_map_60 model-index: - name: SentenceTransformer based on intfloat/multilingual-e5-base results: - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: core uk type: core-uk metrics: - type: dot_accuracy_1 value: 0.8320209973753281 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.94750656167979 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9763779527559056 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9973753280839895 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8320209973753281 name: Dot Precision 1 - type: dot_precision_3 value: 0.7559055118110236 name: Dot Precision 3 - type: dot_precision_5 value: 0.6664041994750657 name: Dot Precision 5 - type: dot_precision_10 value: 0.4056430446194226 name: Dot Precision 10 - type: dot_recall_1 value: 0.1294088238970129 name: Dot Recall 1 - type: dot_recall_3 value: 0.3004817106195059 name: Dot Recall 3 - type: dot_recall_5 value: 0.4111832375119777 name: Dot Recall 5 - type: dot_recall_10 value: 0.4830919572553431 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5994753579249453 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8934778985960088 name: Dot Mrr 10 - type: dot_map_60 value: 0.4285503952344978 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: core ru type: core-ru metrics: - type: dot_accuracy_1 value: 0.8346456692913385 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9461942257217848 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9803149606299213 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9986876640419947 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8346456692913385 name: Dot Precision 1 - type: dot_precision_3 value: 0.752843394575678 name: Dot Precision 3 - type: dot_precision_5 value: 0.6669291338582678 name: Dot Precision 5 - type: dot_precision_10 value: 0.4053805774278215 name: Dot Precision 10 - type: dot_recall_1 value: 0.1298212723409574 name: Dot Recall 1 - type: dot_recall_3 value: 0.30101445652626757 name: Dot Recall 3 - type: dot_recall_5 value: 0.41294421530642006 name: Dot Recall 5 - type: dot_recall_10 value: 0.48331536682914633 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5999177342891409 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8957770903637045 name: Dot Mrr 10 - type: dot_map_60 value: 0.4288323595676725 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: typos uk type: typos-uk metrics: - type: dot_accuracy_1 value: 0.7926509186351706 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.926509186351706 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9606299212598425 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9881889763779528 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.7926509186351706 name: Dot Precision 1 - type: dot_precision_3 value: 0.7309711286089239 name: Dot Precision 3 - type: dot_precision_5 value: 0.6435695538057743 name: Dot Precision 5 - type: dot_precision_10 value: 0.3959317585301838 name: Dot Precision 10 - type: dot_recall_1 value: 0.12145825521809774 name: Dot Recall 1 - type: dot_recall_3 value: 0.29012180769070534 name: Dot Recall 3 - type: dot_recall_5 value: 0.3967324396950382 name: Dot Recall 5 - type: dot_recall_10 value: 0.4715975607215765 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.581057500412081 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8658652043494561 name: Dot Mrr 10 - type: dot_map_60 value: 0.41400075029211947 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: typos ru type: typos-ru metrics: - type: dot_accuracy_1 value: 0.7965879265091863 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9199475065616798 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.963254593175853 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.989501312335958 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.7965879265091863 name: Dot Precision 1 - type: dot_precision_3 value: 0.7270341207349081 name: Dot Precision 3 - type: dot_precision_5 value: 0.6396325459317586 name: Dot Precision 5 - type: dot_precision_10 value: 0.3948818897637796 name: Dot Precision 10 - type: dot_recall_1 value: 0.12179649418822647 name: Dot Recall 1 - type: dot_recall_3 value: 0.28828245427654875 name: Dot Recall 3 - type: dot_recall_5 value: 0.3952852247635713 name: Dot Recall 5 - type: dot_recall_10 value: 0.4706044556930384 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5798984116038256 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8671061950589508 name: Dot Mrr 10 - type: dot_map_60 value: 0.4131583411852339 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: transliterations uk type: transliterations-uk metrics: - type: dot_accuracy_1 value: 0.766153187847668 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.8483097988874626 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.8744116388532306 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9054343175010697 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.766153187847668 name: Dot Precision 1 - type: dot_precision_3 value: 0.5064898017401227 name: Dot Precision 3 - type: dot_precision_5 value: 0.3891313649978605 name: Dot Precision 5 - type: dot_precision_10 value: 0.2199186991869919 name: Dot Precision 10 - type: dot_recall_1 value: 0.23275324999490593 name: Dot Recall 1 - type: dot_recall_3 value: 0.3420168816349818 name: Dot Recall 3 - type: dot_recall_5 value: 0.39086346455569815 name: Dot Recall 5 - type: dot_recall_10 value: 0.4211309523809524 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.508956301515974 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8126512079657152 name: Dot Mrr 10 - type: dot_map_60 value: 0.38863579771140444 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: transliterations ru type: transliterations-ru metrics: - type: dot_accuracy_1 value: 0.7794180573384681 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.8525887890457852 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.8784766795036372 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9080017115960634 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.7794180573384681 name: Dot Precision 1 - type: dot_precision_3 value: 0.5122664384538581 name: Dot Precision 3 - type: dot_precision_5 value: 0.39323919554985026 name: Dot Precision 5 - type: dot_precision_10 value: 0.22148053059477968 name: Dot Precision 10 - type: dot_recall_1 value: 0.23682618640096179 name: Dot Recall 1 - type: dot_recall_3 value: 0.3456468916192922 name: Dot Recall 3 - type: dot_recall_5 value: 0.3944142622817206 name: Dot Recall 5 - type: dot_recall_10 value: 0.42375527232715937 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5144322784291283 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8216956687110742 name: Dot Mrr 10 - type: dot_map_60 value: 0.39385691972827114 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: options uk type: options-uk metrics: - type: dot_accuracy_1 value: 0.8446601941747572 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9490291262135923 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9781553398058253 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 1.0 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8446601941747572 name: Dot Precision 1 - type: dot_precision_3 value: 0.7718446601941747 name: Dot Precision 3 - type: dot_precision_5 value: 0.6063106796116504 name: Dot Precision 5 - type: dot_precision_10 value: 0.34199029126213587 name: Dot Precision 10 - type: dot_recall_1 value: 0.1310188395746648 name: Dot Recall 1 - type: dot_recall_3 value: 0.3430969717984281 name: Dot Recall 3 - type: dot_recall_5 value: 0.4379926606564956 name: Dot Recall 5 - type: dot_recall_10 value: 0.4892495954692557 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5858350840228177 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.90125693481276 name: Dot Mrr 10 - type: dot_map_60 value: 0.42688614899222255 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: options ru type: options-ru metrics: - type: dot_accuracy_1 value: 0.8495145631067961 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9514563106796117 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9805825242718447 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 1.0 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8495145631067961 name: Dot Precision 1 - type: dot_precision_3 value: 0.7783171521035598 name: Dot Precision 3 - type: dot_precision_5 value: 0.6087378640776698 name: Dot Precision 5 - type: dot_precision_10 value: 0.34271844660194173 name: Dot Precision 10 - type: dot_recall_1 value: 0.1317267683772538 name: Dot Recall 1 - type: dot_recall_3 value: 0.34499826629680996 name: Dot Recall 3 - type: dot_recall_5 value: 0.4391657998150717 name: Dot Recall 5 - type: dot_recall_10 value: 0.4902204692556634 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.5876954008561657 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.9059263754045306 name: Dot Mrr 10 - type: dot_map_60 value: 0.4279393522239147 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: rusisms uk type: rusisms-uk metrics: - type: dot_accuracy_1 value: 0.9340659340659341 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.989010989010989 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.989010989010989 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 1.0 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.9340659340659341 name: Dot Precision 1 - type: dot_precision_3 value: 0.8974358974358974 name: Dot Precision 3 - type: dot_precision_5 value: 0.8439560439560441 name: Dot Precision 5 - type: dot_precision_10 value: 0.7340659340659342 name: Dot Precision 10 - type: dot_recall_1 value: 0.08706599171628739 name: Dot Recall 1 - type: dot_recall_3 value: 0.19989710864841587 name: Dot Recall 3 - type: dot_recall_5 value: 0.2688343218652121 name: Dot Recall 5 - type: dot_recall_10 value: 0.38334910122810867 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.8345600775728184 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.9633699633699633 name: Dot Mrr 10 - type: dot_map_60 value: 0.47742090449338376 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: rusisms ru type: rusisms-ru metrics: - type: dot_accuracy_1 value: 0.9340659340659341 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.967032967032967 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.989010989010989 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 1.0 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.9340659340659341 name: Dot Precision 1 - type: dot_precision_3 value: 0.8901098901098901 name: Dot Precision 3 - type: dot_precision_5 value: 0.8351648351648352 name: Dot Precision 5 - type: dot_precision_10 value: 0.7307692307692307 name: Dot Precision 10 - type: dot_recall_1 value: 0.08679126644156213 name: Dot Recall 1 - type: dot_recall_3 value: 0.19670833313821182 name: Dot Recall 3 - type: dot_recall_5 value: 0.26506993149367886 name: Dot Recall 5 - type: dot_recall_10 value: 0.37986353450724775 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.829925608135021 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.9568681318681319 name: Dot Mrr 10 - type: dot_map_60 value: 0.47418152230283284 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: jargonisms uk type: jargonisms-uk metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9487179487179487 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9743589743589743 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9743589743589743 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_precision_3 value: 0.8034188034188033 name: Dot Precision 3 - type: dot_precision_5 value: 0.764102564102564 name: Dot Precision 5 - type: dot_precision_10 value: 0.6410256410256411 name: Dot Precision 10 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_recall_3 value: 0.23257036314816631 name: Dot Recall 3 - type: dot_recall_5 value: 0.31969907899541766 name: Dot Recall 5 - type: dot_recall_10 value: 0.4288263224189998 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.7773893071603697 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.9239316239316239 name: Dot Mrr 10 - type: dot_map_60 value: 0.45570765102853333 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: jargonisms ru type: jargonisms-ru metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9487179487179487 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9743589743589743 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9743589743589743 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_precision_3 value: 0.7948717948717948 name: Dot Precision 3 - type: dot_precision_5 value: 0.758974358974359 name: Dot Precision 5 - type: dot_precision_10 value: 0.6384615384615385 name: Dot Precision 10 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_recall_3 value: 0.2307388613166645 name: Dot Recall 3 - type: dot_recall_5 value: 0.31713497643131505 name: Dot Recall 5 - type: dot_recall_10 value: 0.4275442711369486 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.7742726554934242 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.9239316239316239 name: Dot Mrr 10 - type: dot_map_60 value: 0.4534919139776314 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: vespa uk type: vespa-uk metrics: - type: dot_accuracy_1 value: 0.8695652173913043 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.9021739130434783 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.9130434782608695 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9239130434782609 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8695652173913043 name: Dot Precision 1 - type: dot_precision_3 value: 0.8043478260869565 name: Dot Precision 3 - type: dot_precision_5 value: 0.7717391304347826 name: Dot Precision 5 - type: dot_precision_10 value: 0.6836956521739131 name: Dot Precision 10 - type: dot_recall_1 value: 0.06883175868145536 name: Dot Recall 1 - type: dot_recall_3 value: 0.14103572265779404 name: Dot Recall 3 - type: dot_recall_5 value: 0.18398521310559096 name: Dot Recall 5 - type: dot_recall_10 value: 0.23868263992848113 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.7717438650633948 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8856280193236714 name: Dot Mrr 10 - type: dot_map_60 value: 0.5732330257602632 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: vespa ru type: vespa-ru metrics: - type: dot_accuracy_1 value: 0.8369565217391305 name: Dot Accuracy 1 - type: dot_accuracy_3 value: 0.8913043478260869 name: Dot Accuracy 3 - type: dot_accuracy_5 value: 0.8913043478260869 name: Dot Accuracy 5 - type: dot_accuracy_10 value: 0.9021739130434783 name: Dot Accuracy 10 - type: dot_precision_1 value: 0.8369565217391305 name: Dot Precision 1 - type: dot_precision_3 value: 0.8007246376811594 name: Dot Precision 3 - type: dot_precision_5 value: 0.7543478260869566 name: Dot Precision 5 - type: dot_precision_10 value: 0.6804347826086957 name: Dot Precision 10 - type: dot_recall_1 value: 0.06224227191657334 name: Dot Recall 1 - type: dot_recall_3 value: 0.13528086322210459 name: Dot Recall 3 - type: dot_recall_5 value: 0.1739478766654453 name: Dot Recall 5 - type: dot_recall_10 value: 0.23048904916705776 name: Dot Recall 10 - type: dot_ndcg_10 value: 0.7605101400743094 name: Dot Ndcg 10 - type: dot_mrr_10 value: 0.8641304347826086 name: Dot Mrr 10 - type: dot_map_60 value: 0.565160646959096 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core uk matryoshka dim 768 ' type: core-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8320209973753281 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8320209973753281 name: Dot Precision 1 - type: dot_recall_1 value: 0.1294088238970129 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8320209973753281 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8320209973753281 name: Dot Mrr 1 - type: dot_map_60 value: 0.4285503952344978 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core ru matryoshka dim 768 ' type: core-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8346456692913385 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8346456692913385 name: Dot Precision 1 - type: dot_recall_1 value: 0.1298212723409574 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8346456692913385 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8346456692913385 name: Dot Mrr 1 - type: dot_map_60 value: 0.4288323595676725 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos uk matryoshka dim 768 ' type: typos-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.7926509186351706 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7926509186351706 name: Dot Precision 1 - type: dot_recall_1 value: 0.12145825521809774 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7926509186351706 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7926509186351706 name: Dot Mrr 1 - type: dot_map_60 value: 0.41400075029211947 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos ru matryoshka dim 768 ' type: typos-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.7965879265091863 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7965879265091863 name: Dot Precision 1 - type: dot_recall_1 value: 0.12179649418822647 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7965879265091863 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7965879265091863 name: Dot Mrr 1 - type: dot_map_60 value: 0.4131583411852339 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations uk matryoshka dim 768 ' type: transliterations-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.766153187847668 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.766153187847668 name: Dot Precision 1 - type: dot_recall_1 value: 0.23275324999490593 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.766153187847668 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.766153187847668 name: Dot Mrr 1 - type: dot_map_60 value: 0.38863579771140444 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations ru matryoshka dim 768 ' type: transliterations-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.7794180573384681 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7794180573384681 name: Dot Precision 1 - type: dot_recall_1 value: 0.23682618640096179 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7794180573384681 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7794180573384681 name: Dot Mrr 1 - type: dot_map_60 value: 0.39385691972827114 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options uk matryoshka dim 768 ' type: options-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8446601941747572 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8446601941747572 name: Dot Precision 1 - type: dot_recall_1 value: 0.1310188395746648 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8446601941747572 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8446601941747572 name: Dot Mrr 1 - type: dot_map_60 value: 0.42688614899222255 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options ru matryoshka dim 768 ' type: options-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8495145631067961 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8495145631067961 name: Dot Precision 1 - type: dot_recall_1 value: 0.1317267683772538 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8495145631067961 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8495145631067961 name: Dot Mrr 1 - type: dot_map_60 value: 0.4279393522239147 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms uk matryoshka dim 768 ' type: rusisms-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.9340659340659341 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9340659340659341 name: Dot Precision 1 - type: dot_recall_1 value: 0.08706599171628739 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9340659340659341 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9340659340659341 name: Dot Mrr 1 - type: dot_map_60 value: 0.47742090449338376 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms ru matryoshka dim 768 ' type: rusisms-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.9340659340659341 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9340659340659341 name: Dot Precision 1 - type: dot_recall_1 value: 0.08679126644156213 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9340659340659341 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9340659340659341 name: Dot Mrr 1 - type: dot_map_60 value: 0.47418152230283284 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms uk matryoshka dim 768 ' type: jargonisms-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.45570765102853333 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms ru matryoshka dim 768 ' type: jargonisms-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.4534919139776314 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa uk matryoshka dim 768 ' type: vespa-uk--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8695652173913043 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8695652173913043 name: Dot Precision 1 - type: dot_recall_1 value: 0.06883175868145536 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8695652173913043 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8695652173913043 name: Dot Mrr 1 - type: dot_map_60 value: 0.5732330257602632 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa ru matryoshka dim 768 ' type: vespa-ru--matryoshka_dim-768-- metrics: - type: dot_accuracy_1 value: 0.8369565217391305 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8369565217391305 name: Dot Precision 1 - type: dot_recall_1 value: 0.06224227191657334 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8369565217391305 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8369565217391305 name: Dot Mrr 1 - type: dot_map_60 value: 0.565160646959096 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core uk matryoshka dim 512 ' type: core-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.821522309711286 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.821522309711286 name: Dot Precision 1 - type: dot_recall_1 value: 0.1292119735033121 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.821522309711286 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.821522309711286 name: Dot Mrr 1 - type: dot_map_60 value: 0.4275924113816673 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core ru matryoshka dim 512 ' type: core-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8188976377952756 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8188976377952756 name: Dot Precision 1 - type: dot_recall_1 value: 0.12844540265800108 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8188976377952756 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8188976377952756 name: Dot Mrr 1 - type: dot_map_60 value: 0.4273910265590936 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos uk matryoshka dim 512 ' type: typos-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.7795275590551181 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7795275590551181 name: Dot Precision 1 - type: dot_recall_1 value: 0.12051774778152732 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7795275590551181 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7795275590551181 name: Dot Mrr 1 - type: dot_map_60 value: 0.41040405788146145 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos ru matryoshka dim 512 ' type: typos-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.7782152230971129 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7782152230971129 name: Dot Precision 1 - type: dot_recall_1 value: 0.11916375036453776 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7782152230971129 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7782152230971129 name: Dot Mrr 1 - type: dot_map_60 value: 0.40931753436850665 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations uk matryoshka dim 512 ' type: transliterations-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.751604621309371 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.751604621309371 name: Dot Precision 1 - type: dot_recall_1 value: 0.22918742486297042 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.751604621309371 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.751604621309371 name: Dot Mrr 1 - type: dot_map_60 value: 0.3818314123132323 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations ru matryoshka dim 512 ' type: transliterations-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.7655113393239196 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7655113393239196 name: Dot Precision 1 - type: dot_recall_1 value: 0.2339432167817919 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7655113393239196 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7655113393239196 name: Dot Mrr 1 - type: dot_map_60 value: 0.387110849655481 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options uk matryoshka dim 512 ' type: options-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8398058252427184 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8398058252427184 name: Dot Precision 1 - type: dot_recall_1 value: 0.13041204345816 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8398058252427184 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8398058252427184 name: Dot Mrr 1 - type: dot_map_60 value: 0.4262844115027504 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options ru matryoshka dim 512 ' type: options-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8398058252427184 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8398058252427184 name: Dot Precision 1 - type: dot_recall_1 value: 0.1305131761442441 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8398058252427184 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8398058252427184 name: Dot Mrr 1 - type: dot_map_60 value: 0.4269223943661596 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms uk matryoshka dim 512 ' type: rusisms-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.945054945054945 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.945054945054945 name: Dot Precision 1 - type: dot_recall_1 value: 0.0870529095603481 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.945054945054945 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.945054945054945 name: Dot Mrr 1 - type: dot_map_60 value: 0.47622797404209144 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms ru matryoshka dim 512 ' type: rusisms-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.945054945054945 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.945054945054945 name: Dot Precision 1 - type: dot_recall_1 value: 0.0870529095603481 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.945054945054945 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.945054945054945 name: Dot Mrr 1 - type: dot_map_60 value: 0.47487533195888043 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms uk matryoshka dim 512 ' type: jargonisms-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.45529622369157835 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms ru matryoshka dim 512 ' type: jargonisms-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.4537336247678682 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa uk matryoshka dim 512 ' type: vespa-uk--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8478260869565217 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8478260869565217 name: Dot Precision 1 - type: dot_recall_1 value: 0.06826609763442786 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8478260869565217 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8478260869565217 name: Dot Mrr 1 - type: dot_map_60 value: 0.573179058797186 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa ru matryoshka dim 512 ' type: vespa-ru--matryoshka_dim-512-- metrics: - type: dot_accuracy_1 value: 0.8478260869565217 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8478260869565217 name: Dot Precision 1 - type: dot_recall_1 value: 0.06292161974266029 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8478260869565217 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8478260869565217 name: Dot Mrr 1 - type: dot_map_60 value: 0.5640163373561312 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core uk matryoshka dim 256 ' type: core-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8123359580052494 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8123359580052494 name: Dot Precision 1 - type: dot_recall_1 value: 0.12785563262925467 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8123359580052494 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8123359580052494 name: Dot Mrr 1 - type: dot_map_60 value: 0.4231521702068554 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core ru matryoshka dim 256 ' type: core-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8123359580052494 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8123359580052494 name: Dot Precision 1 - type: dot_recall_1 value: 0.1277462712994209 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8123359580052494 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8123359580052494 name: Dot Mrr 1 - type: dot_map_60 value: 0.4232948634132667 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos uk matryoshka dim 256 ' type: typos-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.7821522309711286 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7821522309711286 name: Dot Precision 1 - type: dot_recall_1 value: 0.1204448402283048 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7821522309711286 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7821522309711286 name: Dot Mrr 1 - type: dot_map_60 value: 0.4048477669980251 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos ru matryoshka dim 256 ' type: typos-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.7742782152230971 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7742782152230971 name: Dot Precision 1 - type: dot_recall_1 value: 0.11884113444152813 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7742782152230971 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7742782152230971 name: Dot Mrr 1 - type: dot_map_60 value: 0.40389791132760394 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations uk matryoshka dim 256 ' type: transliterations-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.7225074882327771 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7225074882327771 name: Dot Precision 1 - type: dot_recall_1 value: 0.22269838722823318 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7225074882327771 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7225074882327771 name: Dot Mrr 1 - type: dot_map_60 value: 0.36538168857405573 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations ru matryoshka dim 256 ' type: transliterations-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.7334189131364998 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7334189131364998 name: Dot Precision 1 - type: dot_recall_1 value: 0.22648160034231923 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7334189131364998 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7334189131364998 name: Dot Mrr 1 - type: dot_map_60 value: 0.37079946410146875 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options uk matryoshka dim 256 ' type: options-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8398058252427184 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8398058252427184 name: Dot Precision 1 - type: dot_recall_1 value: 0.13063453536754507 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8398058252427184 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8398058252427184 name: Dot Mrr 1 - type: dot_map_60 value: 0.4210579878658755 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options ru matryoshka dim 256 ' type: options-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.837378640776699 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.837378640776699 name: Dot Precision 1 - type: dot_recall_1 value: 0.1302300046232085 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.837378640776699 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.837378640776699 name: Dot Mrr 1 - type: dot_map_60 value: 0.4212571504782112 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms uk matryoshka dim 256 ' type: rusisms-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.945054945054945 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.945054945054945 name: Dot Precision 1 - type: dot_recall_1 value: 0.0879386484712971 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.945054945054945 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.945054945054945 name: Dot Mrr 1 - type: dot_map_60 value: 0.47356620314355136 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms ru matryoshka dim 256 ' type: rusisms-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.9340659340659341 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9340659340659341 name: Dot Precision 1 - type: dot_recall_1 value: 0.08656502209767072 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9340659340659341 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9340659340659341 name: Dot Mrr 1 - type: dot_map_60 value: 0.47320492151848786 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms uk matryoshka dim 256 ' type: jargonisms-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1165954934547612 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.4578428190173281 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms ru matryoshka dim 256 ' type: jargonisms-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.9230769230769231 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9230769230769231 name: Dot Precision 1 - type: dot_recall_1 value: 0.12941600627527403 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9230769230769231 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9230769230769231 name: Dot Mrr 1 - type: dot_map_60 value: 0.46545068038766446 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa uk matryoshka dim 256 ' type: vespa-uk--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8586956521739131 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8586956521739131 name: Dot Precision 1 - type: dot_recall_1 value: 0.07324770669918204 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8586956521739131 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8586956521739131 name: Dot Mrr 1 - type: dot_map_60 value: 0.5721859123204845 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa ru matryoshka dim 256 ' type: vespa-ru--matryoshka_dim-256-- metrics: - type: dot_accuracy_1 value: 0.8369565217391305 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8369565217391305 name: Dot Precision 1 - type: dot_recall_1 value: 0.06201582264121103 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8369565217391305 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8369565217391305 name: Dot Mrr 1 - type: dot_map_60 value: 0.5605933202351481 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core uk matryoshka dim 128 ' type: core-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.7979002624671916 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7979002624671916 name: Dot Precision 1 - type: dot_recall_1 value: 0.125930352455943 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7979002624671916 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7979002624671916 name: Dot Mrr 1 - type: dot_map_60 value: 0.41610108615224095 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'core ru matryoshka dim 128 ' type: core-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.7834645669291339 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7834645669291339 name: Dot Precision 1 - type: dot_recall_1 value: 0.12301561263175437 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7834645669291339 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7834645669291339 name: Dot Mrr 1 - type: dot_map_60 value: 0.41480113379053846 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos uk matryoshka dim 128 ' type: typos-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.7545931758530183 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7545931758530183 name: Dot Precision 1 - type: dot_recall_1 value: 0.11586989126359205 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7545931758530183 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7545931758530183 name: Dot Mrr 1 - type: dot_map_60 value: 0.394110056272876 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'typos ru matryoshka dim 128 ' type: typos-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.7598425196850394 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.7598425196850394 name: Dot Precision 1 - type: dot_recall_1 value: 0.11452318460192476 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.7598425196850394 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.7598425196850394 name: Dot Mrr 1 - type: dot_map_60 value: 0.39449879092923534 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations uk matryoshka dim 128 ' type: transliterations-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.6653829696191699 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.6653829696191699 name: Dot Precision 1 - type: dot_recall_1 value: 0.20764589318825516 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.6653829696191699 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.6653829696191699 name: Dot Mrr 1 - type: dot_map_60 value: 0.3379017658701352 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'transliterations ru matryoshka dim 128 ' type: transliterations-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.6777920410783055 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.6777920410783055 name: Dot Precision 1 - type: dot_recall_1 value: 0.2123706114880698 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.6777920410783055 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.6777920410783055 name: Dot Mrr 1 - type: dot_map_60 value: 0.3442573792878016 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options uk matryoshka dim 128 ' type: options-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8106796116504854 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8106796116504854 name: Dot Precision 1 - type: dot_recall_1 value: 0.1263869625520111 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8106796116504854 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8106796116504854 name: Dot Mrr 1 - type: dot_map_60 value: 0.41121686668183804 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'options ru matryoshka dim 128 ' type: options-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8179611650485437 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8179611650485437 name: Dot Precision 1 - type: dot_recall_1 value: 0.1270948913546001 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8179611650485437 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8179611650485437 name: Dot Mrr 1 - type: dot_map_60 value: 0.41072019781780317 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms uk matryoshka dim 128 ' type: rusisms-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.9230769230769231 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9230769230769231 name: Dot Precision 1 - type: dot_recall_1 value: 0.08488614541879404 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9230769230769231 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9230769230769231 name: Dot Mrr 1 - type: dot_map_60 value: 0.46692078180798774 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'rusisms ru matryoshka dim 128 ' type: rusisms-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.9230769230769231 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.9230769230769231 name: Dot Precision 1 - type: dot_recall_1 value: 0.08653449706714568 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.9230769230769231 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.9230769230769231 name: Dot Mrr 1 - type: dot_map_60 value: 0.46604758240291716 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms uk matryoshka dim 128 ' type: jargonisms-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8717948717948718 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8717948717948718 name: Dot Precision 1 - type: dot_recall_1 value: 0.11476399162325937 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8717948717948718 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8717948717948718 name: Dot Mrr 1 - type: dot_map_60 value: 0.4561126872165208 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'jargonisms ru matryoshka dim 128 ' type: jargonisms-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8974358974358975 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8974358974358975 name: Dot Precision 1 - type: dot_recall_1 value: 0.1275845044437722 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8974358974358975 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8974358974358975 name: Dot Mrr 1 - type: dot_map_60 value: 0.4644866652607183 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa uk matryoshka dim 128 ' type: vespa-uk--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8369565217391305 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8369565217391305 name: Dot Precision 1 - type: dot_recall_1 value: 0.06600132988758785 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8369565217391305 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8369565217391305 name: Dot Mrr 1 - type: dot_map_60 value: 0.5618114046393388 name: Dot Map 60 - task: type: rztkinformation-retrieval name: RZTKInformation Retrieval dataset: name: 'vespa ru matryoshka dim 128 ' type: vespa-ru--matryoshka_dim-128-- metrics: - type: dot_accuracy_1 value: 0.8260869565217391 name: Dot Accuracy 1 - type: dot_precision_1 value: 0.8260869565217391 name: Dot Precision 1 - type: dot_recall_1 value: 0.06020422843831247 name: Dot Recall 1 - type: dot_ndcg_1 value: 0.8260869565217391 name: Dot Ndcg 1 - type: dot_mrr_1 value: 0.8260869565217391 name: Dot Mrr 1 - type: dot_map_60 value: 0.5530272686449091 name: Dot Map 60 - task: type: sequential name: Sequential dataset: name: full benchmark type: full-benchmark metrics: - type: avg--matryoshka_dim-768--_dot_accuracy_1 value: 0.8475126368866295 name: Avg--Matryoshka Dim-768-- Dot Accuracy 1 - type: avg--matryoshka_dim-768--_dot_precision_1 value: 0.8475126368866295 name: Avg--Matryoshka Dim-768-- Dot Precision 1 - type: avg--matryoshka_dim-768--_dot_recall_1 value: 0.12663801183267726 name: Avg--Matryoshka Dim-768-- Dot Recall 1 - type: avg--matryoshka_dim-768--_dot_ndcg_1 value: 0.8475126368866295 name: Avg--Matryoshka Dim-768-- Dot Ndcg 1 - type: avg--matryoshka_dim-768--_dot_mrr_1 value: 0.8475126368866295 name: Avg--Matryoshka Dim-768-- Dot Mrr 1 - type: avg--matryoshka_dim-768--_dot_map_60 value: 0.4515039806755055 name: Avg--Matryoshka Dim-768-- Dot Map 60 - type: avg--matryoshka_dim-512--_dot_accuracy_1 value: 0.8411088714051607 name: Avg--Matryoshka Dim-512-- Dot Accuracy 1 - type: avg--matryoshka_dim-512--_dot_precision_1 value: 0.8411088714051607 name: Avg--Matryoshka Dim-512-- Dot Precision 1 - type: avg--matryoshka_dim-512--_dot_recall_1 value: 0.12570566135441796 name: Avg--Matryoshka Dim-512-- Dot Recall 1 - type: avg--matryoshka_dim-512--_dot_ndcg_1 value: 0.8411088714051607 name: Avg--Matryoshka Dim-512-- Dot Ndcg 1 - type: avg--matryoshka_dim-512--_dot_mrr_1 value: 0.8411088714051607 name: Avg--Matryoshka Dim-512-- Dot Mrr 1 - type: avg--matryoshka_dim-512--_dot_map_60 value: 0.44958447490300635 name: Avg--Matryoshka Dim-512-- Dot Map 60 - type: avg--matryoshka_dim-256--_dot_accuracy_1 value: 0.8363927930814402 name: Avg--Matryoshka Dim-256-- Dot Accuracy 1 - type: avg--matryoshka_dim-256--_dot_precision_1 value: 0.8363927930814402 name: Avg--Matryoshka Dim-256-- Dot Precision 1 - type: avg--matryoshka_dim-256--_dot_recall_1 value: 0.12576507898565795 name: Avg--Matryoshka Dim-256-- Dot Recall 1 - type: avg--matryoshka_dim-256--_dot_ndcg_1 value: 0.8363927930814402 name: Avg--Matryoshka Dim-256-- Dot Ndcg 1 - type: avg--matryoshka_dim-256--_dot_mrr_1 value: 0.8363927930814402 name: Avg--Matryoshka Dim-256-- Dot Mrr 1 - type: avg--matryoshka_dim-256--_dot_map_60 value: 0.44546663282771615 name: Avg--Matryoshka Dim-256-- Dot Map 60 - type: avg--matryoshka_dim-128--_dot_accuracy_1 value: 0.8104317432840267 name: Avg--Matryoshka Dim-128-- Dot Accuracy 1 - type: avg--matryoshka_dim-128--_dot_precision_1 value: 0.8104317432840267 name: Avg--Matryoshka Dim-128-- Dot Precision 1 - type: avg--matryoshka_dim-128--_dot_recall_1 value: 0.12091514974393017 name: Avg--Matryoshka Dim-128-- Dot Recall 1 - type: avg--matryoshka_dim-128--_dot_ndcg_1 value: 0.8104317432840267 name: Avg--Matryoshka Dim-128-- Dot Ndcg 1 - type: avg--matryoshka_dim-128--_dot_mrr_1 value: 0.8104317432840267 name: Avg--Matryoshka Dim-128-- Dot Mrr 1 - type: avg--matryoshka_dim-128--_dot_map_60 value: 0.4351438333410615 name: Avg--Matryoshka Dim-128-- Dot Map 60 --- # SentenceTransformer based on intfloat/multilingual-e5-base This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) on the core, typos, transliterations, rusisms and jargonisms datasets. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. ## Model Details ### Model Description - **Model Type:** Sentence Transformer - **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) - **Maximum Sequence Length:** 512 tokens - **Output Dimensionality:** 768 dimensions - **Similarity Function:** Dot Product - **Training Datasets:** - core - typos - transliterations - rusisms - jargonisms ### Model Sources - **Documentation:** [Sentence Transformers Documentation](https://sbert.net) - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) ### Full Model Architecture ``` RZTKSentenceTransformer( (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) (2): Normalize() ) ``` ## Usage ### Direct Usage (Sentence Transformers) First install the Sentence Transformers library: ```bash pip install -U sentence-transformers ``` Then you can load this model and run inference. ```python from sentence_transformers import SentenceTransformer # Download from the 🤗 Hub model = SentenceTransformer("yklymchuk-rztk/multiple-datasets-e5-jina-mnr-1-resume") # Run inference sentences = [ 'query: чоловічіпіжами', 'passage: Пижамные штаны мужские Vienetta XL синий 311236 Мужские пижамы Vienetta', 'passage: Зарядная станция EcoFlow DELTA 2 (ZMR330-EU) Зарядные станции EcoFlow Тип аккумуляторов Литий-железо-фосфатные (LiFePO4) Назначение Для всего дома Особенности Быстрая зарядка батареи Страна-производитель товара Китай Выходные интерфейсы USB Type A Выходные интерфейсы USB Type C Емкость зарядной станции, Вт*ч 1024 Выходная мощность (общая), Вт 1800 Максимальная мощность устройств, Вт 2400 Тип (версия) розеток Европейская Количество портов USB Type A 2 Количество портов USB Type С 2 Количество розеток 4', ] embeddings = model.encode(sentences) print(embeddings.shape) # [3, 768] # Get the similarity scores for the embeddings similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] ``` ## Evaluation ### Metrics #### RZTKInformation Retrieval * Datasets: `core-uk`, `core-ru`, `typos-uk`, `typos-ru`, `transliterations-uk`, `transliterations-ru`, `options-uk`, `options-ru`, `rusisms-uk`, `rusisms-ru`, `jargonisms-uk`, `jargonisms-ru`, `vespa-uk` and `vespa-ru` * Evaluated with sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator | Metric | core-uk | core-ru | typos-uk | typos-ru | transliterations-uk | transliterations-ru | options-uk | options-ru | rusisms-uk | rusisms-ru | jargonisms-uk | jargonisms-ru | vespa-uk | vespa-ru | |:-----------------|:-----------|:-----------|:-----------|:-----------|:--------------------|:--------------------|:-----------|:-----------|:-----------|:-----------|:--------------|:--------------|:-----------|:-----------| | dot_accuracy_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | | dot_accuracy_3 | 0.9475 | 0.9462 | 0.9265 | 0.9199 | 0.8483 | 0.8526 | 0.949 | 0.9515 | 0.989 | 0.967 | 0.9487 | 0.9487 | 0.9022 | 0.8913 | | dot_accuracy_5 | 0.9764 | 0.9803 | 0.9606 | 0.9633 | 0.8744 | 0.8785 | 0.9782 | 0.9806 | 0.989 | 0.989 | 0.9744 | 0.9744 | 0.913 | 0.8913 | | dot_accuracy_10 | 0.9974 | 0.9987 | 0.9882 | 0.9895 | 0.9054 | 0.908 | 1.0 | 1.0 | 1.0 | 1.0 | 0.9744 | 0.9744 | 0.9239 | 0.9022 | | dot_precision_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | | dot_precision_3 | 0.7559 | 0.7528 | 0.731 | 0.727 | 0.5065 | 0.5123 | 0.7718 | 0.7783 | 0.8974 | 0.8901 | 0.8034 | 0.7949 | 0.8043 | 0.8007 | | dot_precision_5 | 0.6664 | 0.6669 | 0.6436 | 0.6396 | 0.3891 | 0.3932 | 0.6063 | 0.6087 | 0.844 | 0.8352 | 0.7641 | 0.759 | 0.7717 | 0.7543 | | dot_precision_10 | 0.4056 | 0.4054 | 0.3959 | 0.3949 | 0.2199 | 0.2215 | 0.342 | 0.3427 | 0.7341 | 0.7308 | 0.641 | 0.6385 | 0.6837 | 0.6804 | | dot_recall_1 | 0.1294 | 0.1298 | 0.1215 | 0.1218 | 0.2328 | 0.2368 | 0.131 | 0.1317 | 0.0871 | 0.0868 | 0.1166 | 0.1166 | 0.0688 | 0.0622 | | dot_recall_3 | 0.3005 | 0.301 | 0.2901 | 0.2883 | 0.342 | 0.3456 | 0.3431 | 0.345 | 0.1999 | 0.1967 | 0.2326 | 0.2307 | 0.141 | 0.1353 | | dot_recall_5 | 0.4112 | 0.4129 | 0.3967 | 0.3953 | 0.3909 | 0.3944 | 0.438 | 0.4392 | 0.2688 | 0.2651 | 0.3197 | 0.3171 | 0.184 | 0.1739 | | dot_recall_10 | 0.4831 | 0.4833 | 0.4716 | 0.4706 | 0.4211 | 0.4238 | 0.4892 | 0.4902 | 0.3833 | 0.3799 | 0.4288 | 0.4275 | 0.2387 | 0.2305 | | **dot_ndcg_10** | **0.5995** | **0.5999** | **0.5811** | **0.5799** | **0.509** | **0.5144** | **0.5858** | **0.5877** | **0.8346** | **0.8299** | **0.7774** | **0.7743** | **0.7717** | **0.7605** | | dot_mrr_10 | 0.8935 | 0.8958 | 0.8659 | 0.8671 | 0.8127 | 0.8217 | 0.9013 | 0.9059 | 0.9634 | 0.9569 | 0.9239 | 0.9239 | 0.8856 | 0.8641 | | dot_map_60 | 0.4286 | 0.4288 | 0.414 | 0.4132 | 0.3886 | 0.3939 | 0.4269 | 0.4279 | 0.4774 | 0.4742 | 0.4557 | 0.4535 | 0.5732 | 0.5652 | #### RZTKInformation Retrieval * Datasets: `core-uk--matryoshka_dim-768--`, `core-ru--matryoshka_dim-768--`, `typos-uk--matryoshka_dim-768--`, `typos-ru--matryoshka_dim-768--`, `transliterations-uk--matryoshka_dim-768--`, `transliterations-ru--matryoshka_dim-768--`, `options-uk--matryoshka_dim-768--`, `options-ru--matryoshka_dim-768--`, `rusisms-uk--matryoshka_dim-768--`, `rusisms-ru--matryoshka_dim-768--`, `jargonisms-uk--matryoshka_dim-768--`, `jargonisms-ru--matryoshka_dim-768--`, `vespa-uk--matryoshka_dim-768--`, `vespa-ru--matryoshka_dim-768--`, `core-uk--matryoshka_dim-512--`, `core-ru--matryoshka_dim-512--`, `typos-uk--matryoshka_dim-512--`, `typos-ru--matryoshka_dim-512--`, `transliterations-uk--matryoshka_dim-512--`, `transliterations-ru--matryoshka_dim-512--`, `options-uk--matryoshka_dim-512--`, `options-ru--matryoshka_dim-512--`, `rusisms-uk--matryoshka_dim-512--`, `rusisms-ru--matryoshka_dim-512--`, `jargonisms-uk--matryoshka_dim-512--`, `jargonisms-ru--matryoshka_dim-512--`, `vespa-uk--matryoshka_dim-512--`, `vespa-ru--matryoshka_dim-512--`, `core-uk--matryoshka_dim-256--`, `core-ru--matryoshka_dim-256--`, `typos-uk--matryoshka_dim-256--`, `typos-ru--matryoshka_dim-256--`, `transliterations-uk--matryoshka_dim-256--`, `transliterations-ru--matryoshka_dim-256--`, `options-uk--matryoshka_dim-256--`, `options-ru--matryoshka_dim-256--`, `rusisms-uk--matryoshka_dim-256--`, `rusisms-ru--matryoshka_dim-256--`, `jargonisms-uk--matryoshka_dim-256--`, `jargonisms-ru--matryoshka_dim-256--`, `vespa-uk--matryoshka_dim-256--`, `vespa-ru--matryoshka_dim-256--`, `core-uk--matryoshka_dim-128--`, `core-ru--matryoshka_dim-128--`, `typos-uk--matryoshka_dim-128--`, `typos-ru--matryoshka_dim-128--`, `transliterations-uk--matryoshka_dim-128--`, `transliterations-ru--matryoshka_dim-128--`, `options-uk--matryoshka_dim-128--`, `options-ru--matryoshka_dim-128--`, `rusisms-uk--matryoshka_dim-128--`, `rusisms-ru--matryoshka_dim-128--`, `jargonisms-uk--matryoshka_dim-128--`, `jargonisms-ru--matryoshka_dim-128--`, `vespa-uk--matryoshka_dim-128--` and `vespa-ru--matryoshka_dim-128--` * Evaluated with sentence_transformers_training.evaluation.information_retrieval_evaluator.RZTKInformationRetrievalEvaluator | Metric | core-uk--matryoshka_dim-768-- | core-ru--matryoshka_dim-768-- | typos-uk--matryoshka_dim-768-- | typos-ru--matryoshka_dim-768-- | transliterations-uk--matryoshka_dim-768-- | transliterations-ru--matryoshka_dim-768-- | options-uk--matryoshka_dim-768-- | options-ru--matryoshka_dim-768-- | rusisms-uk--matryoshka_dim-768-- | rusisms-ru--matryoshka_dim-768-- | jargonisms-uk--matryoshka_dim-768-- | jargonisms-ru--matryoshka_dim-768-- | vespa-uk--matryoshka_dim-768-- | vespa-ru--matryoshka_dim-768-- | core-uk--matryoshka_dim-512-- | core-ru--matryoshka_dim-512-- | typos-uk--matryoshka_dim-512-- | typos-ru--matryoshka_dim-512-- | transliterations-uk--matryoshka_dim-512-- | transliterations-ru--matryoshka_dim-512-- | options-uk--matryoshka_dim-512-- | options-ru--matryoshka_dim-512-- | rusisms-uk--matryoshka_dim-512-- | rusisms-ru--matryoshka_dim-512-- | jargonisms-uk--matryoshka_dim-512-- | jargonisms-ru--matryoshka_dim-512-- | vespa-uk--matryoshka_dim-512-- | vespa-ru--matryoshka_dim-512-- | core-uk--matryoshka_dim-256-- | core-ru--matryoshka_dim-256-- | typos-uk--matryoshka_dim-256-- | typos-ru--matryoshka_dim-256-- | transliterations-uk--matryoshka_dim-256-- | transliterations-ru--matryoshka_dim-256-- | options-uk--matryoshka_dim-256-- | options-ru--matryoshka_dim-256-- | rusisms-uk--matryoshka_dim-256-- | rusisms-ru--matryoshka_dim-256-- | jargonisms-uk--matryoshka_dim-256-- | jargonisms-ru--matryoshka_dim-256-- | vespa-uk--matryoshka_dim-256-- | vespa-ru--matryoshka_dim-256-- | core-uk--matryoshka_dim-128-- | core-ru--matryoshka_dim-128-- | typos-uk--matryoshka_dim-128-- | typos-ru--matryoshka_dim-128-- | transliterations-uk--matryoshka_dim-128-- | transliterations-ru--matryoshka_dim-128-- | options-uk--matryoshka_dim-128-- | options-ru--matryoshka_dim-128-- | rusisms-uk--matryoshka_dim-128-- | rusisms-ru--matryoshka_dim-128-- | jargonisms-uk--matryoshka_dim-128-- | jargonisms-ru--matryoshka_dim-128-- | vespa-uk--matryoshka_dim-128-- | vespa-ru--matryoshka_dim-128-- | |:----------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------|:------------------------------|:------------------------------|:-------------------------------|:-------------------------------|:------------------------------------------|:------------------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:---------------------------------|:------------------------------------|:------------------------------------|:-------------------------------|:-------------------------------| | dot_accuracy_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 | | dot_precision_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 | | dot_recall_1 | 0.1294 | 0.1298 | 0.1215 | 0.1218 | 0.2328 | 0.2368 | 0.131 | 0.1317 | 0.0871 | 0.0868 | 0.1166 | 0.1166 | 0.0688 | 0.0622 | 0.1292 | 0.1284 | 0.1205 | 0.1192 | 0.2292 | 0.2339 | 0.1304 | 0.1305 | 0.0871 | 0.0871 | 0.1166 | 0.1166 | 0.0683 | 0.0629 | 0.1279 | 0.1277 | 0.1204 | 0.1188 | 0.2227 | 0.2265 | 0.1306 | 0.1302 | 0.0879 | 0.0866 | 0.1166 | 0.1294 | 0.0732 | 0.062 | 0.1259 | 0.123 | 0.1159 | 0.1145 | 0.2076 | 0.2124 | 0.1264 | 0.1271 | 0.0849 | 0.0865 | 0.1148 | 0.1276 | 0.066 | 0.0602 | | **dot_ndcg_1** | **0.832** | **0.8346** | **0.7927** | **0.7966** | **0.7662** | **0.7794** | **0.8447** | **0.8495** | **0.9341** | **0.9341** | **0.8974** | **0.8974** | **0.8696** | **0.837** | **0.8215** | **0.8189** | **0.7795** | **0.7782** | **0.7516** | **0.7655** | **0.8398** | **0.8398** | **0.9451** | **0.9451** | **0.8974** | **0.8974** | **0.8478** | **0.8478** | **0.8123** | **0.8123** | **0.7822** | **0.7743** | **0.7225** | **0.7334** | **0.8398** | **0.8374** | **0.9451** | **0.9341** | **0.8974** | **0.9231** | **0.8587** | **0.837** | **0.7979** | **0.7835** | **0.7546** | **0.7598** | **0.6654** | **0.6778** | **0.8107** | **0.818** | **0.9231** | **0.9231** | **0.8718** | **0.8974** | **0.837** | **0.8261** | | dot_mrr_1 | 0.832 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.837 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.837 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.818 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.837 | 0.8261 | | dot_map_60 | 0.4286 | 0.4288 | 0.414 | 0.4132 | 0.3886 | 0.3939 | 0.4269 | 0.4279 | 0.4774 | 0.4742 | 0.4557 | 0.4535 | 0.5732 | 0.5652 | 0.4276 | 0.4274 | 0.4104 | 0.4093 | 0.3818 | 0.3871 | 0.4263 | 0.4269 | 0.4762 | 0.4749 | 0.4553 | 0.4537 | 0.5732 | 0.564 | 0.4232 | 0.4233 | 0.4048 | 0.4039 | 0.3654 | 0.3708 | 0.4211 | 0.4213 | 0.4736 | 0.4732 | 0.4578 | 0.4655 | 0.5722 | 0.5606 | 0.4161 | 0.4148 | 0.3941 | 0.3945 | 0.3379 | 0.3443 | 0.4112 | 0.4107 | 0.4669 | 0.466 | 0.4561 | 0.4645 | 0.5618 | 0.553 | #### Sequential * Dataset: `full-benchmark` * Evaluated with [SequentialEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.SequentialEvaluator) | Metric | Value | |:------------------------------------------|:-------| | avg--matryoshka_dim-768--_dot_accuracy_1 | 0.8475 | | avg--matryoshka_dim-768--_dot_precision_1 | 0.8475 | | avg--matryoshka_dim-768--_dot_recall_1 | 0.1266 | | avg--matryoshka_dim-768--_dot_ndcg_1 | 0.8475 | | avg--matryoshka_dim-768--_dot_mrr_1 | 0.8475 | | avg--matryoshka_dim-768--_dot_map_60 | 0.4515 | | avg--matryoshka_dim-512--_dot_accuracy_1 | 0.8411 | | avg--matryoshka_dim-512--_dot_precision_1 | 0.8411 | | avg--matryoshka_dim-512--_dot_recall_1 | 0.1257 | | avg--matryoshka_dim-512--_dot_ndcg_1 | 0.8411 | | avg--matryoshka_dim-512--_dot_mrr_1 | 0.8411 | | avg--matryoshka_dim-512--_dot_map_60 | 0.4496 | | avg--matryoshka_dim-256--_dot_accuracy_1 | 0.8364 | | avg--matryoshka_dim-256--_dot_precision_1 | 0.8364 | | avg--matryoshka_dim-256--_dot_recall_1 | 0.1258 | | avg--matryoshka_dim-256--_dot_ndcg_1 | 0.8364 | | avg--matryoshka_dim-256--_dot_mrr_1 | 0.8364 | | avg--matryoshka_dim-256--_dot_map_60 | 0.4455 | | avg--matryoshka_dim-128--_dot_accuracy_1 | 0.8104 | | avg--matryoshka_dim-128--_dot_precision_1 | 0.8104 | | avg--matryoshka_dim-128--_dot_recall_1 | 0.1209 | | avg--matryoshka_dim-128--_dot_ndcg_1 | 0.8104 | | avg--matryoshka_dim-128--_dot_mrr_1 | 0.8104 | | avg--matryoshka_dim-128--_dot_map_60 | 0.4351 | ## Training Details ### Training Datasets #### core * Dataset: core * Size: 39,853,448 training samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:----------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: campingaz fold n cool classic 10l dark blue | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає | | query: campingaz 10 | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає | | query: campingaz fold n cool classic 10l dark blue | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукция Campingaz Гарантия 14 дней Вид Термосумки Цвет Синий с белым Режим работы Охлаждение Страна регистрации бренда Франция Страна-производитель товара Китай Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Нет | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### typos * Dataset: typos * Size: 11,780,774 training samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: єлектрорадимтор | passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий | | query: електрордиатор теплотер | passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий | | query: электрически ракдиатор | passage: Електрорадіатор Теплотерм 500-10 Електричні конвектори Mirteco Гарантія 24 місяці Монтаж Настінний Фільтрація повітря_old Немає Цифровий датчик температури_old Є Можливість використання у ванних кімнатах_old Немає Коліщатка/ніжки для переміщення_old Немає Країна реєстрації бренда Словаччина Країна-виробник товару Україна Керування Електронне Функції захисту Захист від замерзання Потужність, Вт 1200 Площа обслуговування, кв. м 15 Колір Білий | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### transliterations * Dataset: transliterations * Size: 14,660,140 training samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:----------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: campingaz fold n cool classic 10l дарк blue | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає | | query: campingaz fold n cool classic 10l дорк blue | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає | | query: campingaz fold n кул classic 10l dark blue | passage: Термосумка Campingaz Fold'n Cool Classic 10L Dark Blue (4823082704729) Термопродукція Campingaz Гарантія 14 днів Вид Термосумки Колір Синій з білим Режим роботи Охолодження Країна реєстрації бренда Франція Країна-виробник товару Китай Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Немає | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### rusisms * Dataset: rusisms * Size: 11,205,398 training samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: насос вібраціоныі̆ шланг | passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав | | query: насос вібраціониі̆ шланг | passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав | | query: насос погружной ніжні̆ забор | passage: Вібраційний насос Акулятко нижній паркан 3 клапана ПТ-5665 Занурювальні насоси Гарантія 12 місяців Живлення Мережа Тип Вібраційні насоси Матеріал корпусу Алюмінієвий сплав | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### jargonisms * Dataset: jargonisms * Size: 2,873,842 training samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:-------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: кроси для баскетболу дитячі | passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33 | | query: кроси для баскетболу | passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33 | | query: баскетбольні кроси дитячі 10 років | passage: Баскетбольні кросівки дитячі SP-Sport 283-WRK розмір 33 White-Black-Red Кросівки для хлопчиків Колір Червоний Колір Білий Колір Чорний Матеріал верху Поліуретан Матеріал підошви Гума Розмір 33 | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` ### Evaluation Datasets #### core_uk * Dataset: core_uk * Size: 3,220 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:---------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: лампочка е27 | passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA | | query: лампочка е27 | passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA | | query: лампочка е27 | passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### core_ru * Dataset: core_ru * Size: 3,220 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:---------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: лампочка е27 | passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA | | query: лампочка е27 | passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA | | query: лампочка е27 | passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### typos_uk * Dataset: typos_uk * Size: 3,220 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: лампочка е7 | passage: Світлодіодна лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампи OSRAM Гарантія 36 місяців Виробник світлодіодів Osram Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів RGB (різнокольоровий) Колір світіння / Температура кольорів Теплий білий Світловий потік 806 Лм Еквівалент потужності лампи розжарювання 60 Вт Робоча напруга, в 230 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Матовий Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Кількість предметів, шт 1 Країна-виробник товару Китай Особливості З дистанційним управлінням Особливості З регулюванням яскравості (димер) Строк служби лампи, год 25000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 9 Можливість доставки Почтомати Доставка Premium Доставка Доставка в магазини ROZETKA | | query: лампочка е7 | passage: Світлодіодна лампа Philips Ecohome LED Bulb 11 W E27 3000 K 1PF/20RCA (929002299567R) 2 шт. Лампи Philips Гарантія 24 місяці Тип цоколя E27 Колір світіння / Температура кольорів Теплий Світловий потік 1150 Лм Еквівалент потужності лампи розжарювання 95 Вт Робоча напруга, в 170-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Колір колби Білий Кількість вантажних місць 1 Країна реєстрації бренда Нідерланди Кількість предметів, шт 2 Країна-виробник товару Китай Строк служби лампи, год теги лампи недорого Тип гарантійного талона Гарантійний талон магазина Потужність, Вт 11 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 3000 К Матеріал колби Пластик Доставка Premium Доставка Доставка в магазини ROZETKA | | query: лампочка е7 | passage: Набір світлодіодних ламп Евросвет 12 W 4200 K Е27 (56702) 4 шт. Лампи Євросвітло Гарантія 12 місяців Тип світлодіодів SMD Тип цоколя E27 Колір світіння / Температура кольорів Нейтральний-білий Світловий потік 1200 Лм Еквівалент потужності лампи розжарювання 120 Вт Робоча напруга, в 220-240 Тип Світлодіодні лампи Форма колби Стандартна (груша) Кількість вантажних місць 1 Країна реєстрації бренда Україна Кількість предметів, шт 4 Країна-виробник товару Китай Строк служби лампи, год 15000 теги лампи недорого Тип гарантійного талона Гарантія по чеку Потужність, Вт 12 Застосування Побутові Призначення Для настільної лампи Призначення Для люстри Призначення Для стельових світильників Температура світіння 4200К Матеріал колби Пластик Доставка Готовий до відправлення Доставка Доставка в магазини ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### typos_ru * Dataset: typos_ru * Size: 3,220 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: лампочка е7 | passage: Светодиодная лампа Osram LED Star+ DIM A60 9W (806Lm) Е27 (4058075430754) Лампы OSRAM Гарантия 36 месяцев Производитель светодиодов Osram Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура RGB (разноцветный) Цвет свечения / Цветовая температура Теплый белый Световой поток 806 Лм Эквивалент мощности лампы накаливания 60 Вт Рабочее напряжение, В 230 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Матовый Количество грузовых мест 1 Страна регистрации бренда Германия Количество предметов, шт 1 Страна-производитель товара Китай Особенности С дистанционным управлением Особенности С регулировкой яркости (диммер) Срок службы лампы, ч 25000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 9 Возможность доставки Почтоматы Доставка Premium Доставка Доставка в магазины ROZETKA | | query: лампочка е7 | passage: Светодиодная лампа Philips Ecohome LED Bulb 11W E27 3000К 1PF/20RCA (929002299567R) 2 шт. Лампы Philips Гарантия 24 месяца Тип цоколя E27 Цвет свечения / Цветовая температура Теплый Световой поток 1150 Лм Эквивалент мощности лампы накаливания 95 Вт Рабочее напряжение, В 170-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Цвет колбы Белый Количество грузовых мест 1 Страна регистрации бренда Нидерланды Количество предметов, шт 2 Страна-производитель товара Китай Срок службы лампы, ч 6000 теги лампы недорого Тип гарантийного талона Гарантийный талон магазина Мощность, Вт 11 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 3000К Материал колбы Пластик Доставка Premium Доставка Доставка в магазины ROZETKA | | query: лампочка е7 | passage: Набор светодиодных ламп ЕВРОСВЕТ 12W 4200к Е27 (56702) 4 шт Лампы Євросвітло Гарантия 12 месяцев Тип светодиодов SMD Тип цоколя E27 Цвет свечения / Цветовая температура Нейтральный-белый Световой поток 1200 Лм Эквивалент мощности лампы накаливания 120 Вт Рабочее напряжение, В 220-240 Тип Светодиодные лампы Форма колбы Стандартная (груша) Количество грузовых мест 1 Страна регистрации бренда Украина Количество предметов, шт 4 Страна-производитель товара Китай Срок службы лампы, ч 15000 теги лампы недорого Тип гарантийного талона Гарантия по чеку Мощность, Вт 12 Применение Бытовые Назначение Для настольной лампы Назначение Для люстры Назначение Для потолочных светильников Температура свечения 4200К Материал колбы Пластик Доставка Готов к отправке Доставка Доставка в магазины ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### transliterations_uk * Dataset: transliterations_uk * Size: 13,144 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: апиэу | passage: Зволожувальний лактокрем для обличчя A'pieu Lactobacillus 50 мл (8809643517201) Крем для обличчя A'pieu Клас косметики Мідл-маркет Час застосування Ніч Вік Від 18 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 50 мл Вид Крем Сфера застосування Обличчя Тип шкіри Суха Тип шкіри Нормальна Призначення Відновлююче Призначення Зволожувальне Доставка Доставка в магазини ROZETKA | | query: апиэу | passage: Тональний засіб A'pieu Клас косметики Мідл-маркет | | query: апиэу | passage: Емульсія мінеральна A'pieu Aqua Marine 180 мл (8809530043608) Засіб для вмивання A'pieu Клас косметики Натуральна Час застосування Універсально Вік Від 20 Стать Для жінок Кількість вантажних місць 1 Країна реєстрації бренда Республіка Корея (Південна Корея) Кількість предметів, шт 1 Серія Aqua Marine Країна-виробник товару Республіка Корея (Південна Корея) Об'єм 180 мл Вид Емульсія Дія Тонізує Дія Зволожує Дія Очищає Тип шкіри Для всіх типів Призначення Зволожувальне Тип гарантійного талона Без гарантійного талона Можливість доставки Почтомати | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### transliterations_ru * Dataset: transliterations_ru * Size: 13,144 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: апиэу | passage: Увлажняющий лакто-крем для лица A'pieu Lactobacillus 50 мл (8809643517201) Крем для лица A'pieu Класс косметики Миддл-маркет Время применения Ночь Возраст От 18 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Страна-производитель товара Республика Корея (Южная Корея) Объем 50 мл Вид Крем Область применения Лицо Тип кожи Сухая Тип кожи Нормальная Назначение Восстанавливающее Назначение Увлажняющее Доставка Доставка в магазины ROZETKA | | query: апиэу | passage: Воздушный хлопковый кушон с матовым финишем. Air-Fit A'pieu Cushion PPOSONG SPF50+/PA+++ 13,5g A'pieu Тональное средство A'pieu Класс косметики Миддл-маркет | | query: апиэу | passage: Эмульсия минеральная A'pieu Aqua Marine 180 мл (8809530043608) Средство для умывания A'pieu Класс косметики Натуральная Время применения Универсально Возраст От 20 Пол Для женщин Количество грузовых мест 1 Страна регистрации бренда Республика Корея (Южная Корея) Количество предметов, шт 1 Серия Aqua Marine Страна-производитель товара Республика Корея (Южная Корея) Объем 180 мл Вид Эмульсия Действие Тонизирует Действие Увлажняет Действие Очищает Тип кожи Для всех типов Назначение Увлажняющее Тип гарантийного талона Без гарантийного талона Возможность доставки Почтоматы | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### options_uk * Dataset: options_uk * Size: 1,442 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:---------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: спортивные шорты женские | passage: Спортивні шорти жіночі Traum 2410-17 M (44-46) Чорні (4820024101721) Жіночі спортивні шорти Traum Сезон Осінній Сезон Літній Сезон Весняний Сезон Демісезонний Кількість вантажних місць 1 Довжина Коротка Країна реєстрації бренда Україна Країна-виробник товару Україна Декор З лампасами Розмір 46 Розмір 44 Стиль Спортивний Колір Чорний Матеріал Трикотаж Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA | | query: спортивные шорты женские | passage: Спортивні шорти жіночі ISSA PLUS 11377 S Чорні (issa2000239538884) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір S Стиль Спортивний Колір Чорний Матеріал Поліестер Матеріал Поліамід Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Доставка Premium Принт Однотонний Доставка Доставка в магазини ROZETKA | | query: спортивные шорты женские | passage: Спортивні шорти жіночі ISSA PLUS 7770 L Чорні (issa2000260293349) Жіночі спортивні шорти ISSA PLUS Кількість вантажних місць 1 Довжина Подовжена Країна реєстрації бренда Україна Країна-виробник товару Україна Розмір L Стиль Спортивний Колір Чорний Матеріал Поліестер Тип гарантійного талона Гарантія по чеку Доставка Premium Принт Напис Тип шортів Прості шорти Доставка Доставка в магазини ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### options_ru * Dataset: options_ru * Size: 1,442 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:---------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: спортивные шорты женские | passage: Спортивные шорты женские Traum 2410-17 M (44-46) Черные (4820024101721) Женские спортивные шорты Traum Сезон Осенний Сезон Летний Сезон Весенний Сезон Демисезонный Количество грузовых мест 1 Длина Короткая Страна регистрации бренда Украина Страна-производитель товара Украина Декор С лампасами Размер 46 Размер 44 Стиль Спортивный Цвет Черный Материал Трикотаж Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA | | query: спортивные шорты женские | passage: Спортивные шорты женские ISSA PLUS 11377 S Черные (issa2000239538884) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Украина Размер S Стиль Спортивный Цвет Черный Материал Полиэстер Материал Полиамид Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Доставка Premium Принт Однотонный Доставка Доставка в магазины ROZETKA | | query: спортивные шорты женские | passage: Спортивные шорты женские ISSA PLUS 7770 L Черные (issa2000260293349) Женские спортивные шорты ISSA PLUS Количество грузовых мест 1 Длина Удлинённая Страна регистрации бренда Украина Страна-производитель товара Украина Размер L Стиль Спортивный Цвет Черный Материал Полиэстер Тип гарантийного талона Гарантия по чеку Доставка Premium Принт Надпись Тип шорт Простые шорты Доставка Доставка в магазины ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### rusisms_uk * Dataset: rusisms_uk * Size: 1,061 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: блок безперебійного пітанія | passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Джерела безперебійного живлення LogicPower Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 10 ТЕГИ У кредит | | query: блок безперебійного пітанія | passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Акумуляторна батарея Вбудована Час роботи за повного навантаження, хв 20 ТЕГИ У кредит | | query: блок безперебійного пітанія | passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Джерела безперебійного живлення EnerGenie Гарантія 12 місяців Тип архітектури Лінійно-інтерактивні (line-interactive) Форма вихідної напруги Апроксимована (ступінчаста) синусоїда Акумуляторна батарея Вбудована Особливості З дисплеєм Час роботи за повного навантаження, хв 8 ТЕГИ У кредит Доставка Доставка в магазини ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### rusisms_ru * Dataset: rusisms_ru * Size: 1,061 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: блок безперебійного пітанія | passage: Блок безперебійного живлення LogicPower LPM-525VA-P (лінійно-інтерактивний, plastik case) Источники бесперебойного питания LogicPower Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 10 ТЕГИ В кредит | | query: блок безперебійного пітанія | passage: Блок безперебійного живлення EnerGenie EG-UPS-B650 650VA Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Аккумуляторная батарея Встроенная Время работы при полной нагрузке, мин 20 ТЕГИ В кредит | | query: блок безперебійного пітанія | passage: Блок безперебійного живлення EnerGenie EG-UPS-031 (LCD дисплей, 650VA, Black) Источники бесперебойного питания EnerGenie Гарантия 12 месяцев Тип архитектуры Линейно-интерактивные (line-interactive) Форма выходного напряжения Аппроксимированная (ступенчатая) синусоида Аккумуляторная батарея Встроенная Особенности С дисплеем Время работы при полной нагрузке, мин 8 ТЕГИ В кредит Доставка Доставка в магазины ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### jargonisms_uk * Dataset: jargonisms_uk * Size: 338 evaluation samples * Columns: query and text * Approximate statistics based on the first 338 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: сумка для лептопа | passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки та чохли для ноутбуків 2E Гарантія 14 днів Діагональ ноутбука 15.6"-16" Матеріал Нейлон Колір Grey Тип Сумка Спосіб закриття Змійка Кількість вантажних місць 1 Країна реєстрації бренда Україна Країна-виробник товару Китай Діагональ сумки/рюкзака 15.6" Тип гарантійного талона Гарантія по чеку Можливість доставки Почтомати Особливості Відділення для аксесуарів | | query: аккумуляторка | passage: Акумуляторна ланцюгова пила Greenworks G24CS25 (2000007) Акумуляторні пилки Greenworks Гарантія 36 місяців Кількість вантажних місць 1 Країна реєстрації бренда США Країна-виробник товару Китай Теги недорогі Теги туристичні Теги професійні Для прив'язки тегів Неймовірно тихий Для прив'язки тегів Потужний двигун Для прив'язки тегів Швидкий запуск Довжина шини, мм 250 Особливості Автоматичне змащування ланцюга Особливості Блокування кнопки увімкнення Вага, кг 2.7 Розташування двигуна в пилі Поперечний (бічний) Швидкість обертання ланцюга, м/сек 4.2 Тип гарантійного талона Гарантійний талон магазина Доставка Premium Напруга акумулятора, В 24 Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA | | query: аккумуляторка | passage: Акумуляторна ланцюгова пила Stark BCS-3610 (310100101) Акумуляторні пилки Stark Гарантія 12 місяців Кількість вантажних місць 1 Країна реєстрації бренда Німеччина Країна-виробник товару Китай Теги недорогі Теги туристичні Довжина шини, мм 250 Особливості SDS система Особливості Гальмо ланцюга Особливості Блокування кнопки увімкнення Особливості Легкий запуск Особливості Автоматичне змащування ланцюга Вага, кг 3.2 Розташування двигуна в пилі Поперечний (бічний) Тип гарантійного талона Гарантійний талон магазина Тип двигуна Безщітковий Акумулятор у комплекті Ні Доставка Доставка в магазини ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### jargonisms_ru * Dataset: jargonisms_ru * Size: 338 evaluation samples * Columns: query and text * Approximate statistics based on the first 338 samples: | | query | text | |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:--------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | query: сумка для лептопа | passage: Сумка для ноутбука 2E 16" Grey (2E-CBN116GR) Сумки, рюкзаки и чехлы для ноутбуков 2E Гарантия 14 дней Диагональ ноутбука 15.6"-16" Материал Нейлон Цвет Grey Тип Сумка Способ закрытия Молния Количество грузовых мест 1 Страна регистрации бренда Украина Страна-производитель товара Китай Диагональ сумки/рюкзака 15.6" Тип гарантийного талона Гарантия по чеку Возможность доставки Почтоматы Особенности Отделение для аксессуаров | | query: аккумуляторка | passage: Аккумуляторная цепная пила Greenworks G24CS25 (2000007) Аккумуляторные пилы Greenworks Гарантия 36 месяцев Количество грузовых мест 1 Страна регистрации бренда США Страна-производитель товара Китай Теги недорогие Теги туристические Теги профессиональные Для привязки тегов Невероятно тихий Для привязки тегов Мощный двигатель Для привязки тегов Быстрый запуск Длина шины, мм 250 Особенности Автоматическая смазка цепи Особенности Блокировка кнопки включения Вес, кг 2.7 Расположение двигателя в пиле Поперечное (боковое) Скорость вращения цепи, м/сек 4.2 Тип гарантийного талона Гарантийный талон магазина Доставка Premium Напряжение аккумулятора, В 24 Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA | | query: аккумуляторка | passage: Аккумуляторная цепная пила Stark BCS-3610 (310100101) Аккумуляторные пилы Stark Гарантия 12 месяцев Количество грузовых мест 1 Страна регистрации бренда Германия Страна-производитель товара Китай Теги недорогие Теги туристические Длина шины, мм 250 Особенности SDS система Особенности Тормоз цепи Особенности Блокировка кнопки включения Особенности Легкий запуск Особенности Автоматическая смазка цепи Вес, кг 3.2 Расположение двигателя в пиле Поперечное (боковое) Тип гарантийного талона Гарантийный талон магазина Тип двигателя Бесщеточный Аккумулятор в комплекте Нет Доставка Доставка в магазины ROZETKA | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### vespa_uk * Dataset: vespa_uk * Size: 5,315 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:---------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------| | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: Перехідники для шлангу басейну Intex з 32 мм на 38 мм (IP-175136) Обладнання для басейнів Intex Вид Комплектувальні | | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: З'єднання для шланга Peraqua діаметр 32 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів | | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: З'єднання для шлангу Peraqua діаметр 32/38 мм Аксесуари для басейнів Вид Інструменти для прибирання басейнів | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` #### vespa_ru * Dataset: vespa_ru * Size: 5,315 evaluation samples * Columns: query and text * Approximate statistics based on the first 1000 samples: | | query | text | |:--------|:---------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | query | text | |:------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------| | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: Переходники для шланга бассейна Intex с 32 мм на 38 мм (IP-175136) Оборудование для бассейнов Intex Вид Комплектующие | | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: Соединение для шланга Peraqua диаметр 32 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов | | query: шланга диаметром 32 мм для викачки брудної води з басейну | passage: Соединение для шланга Peraqua диаметр 32/38 мм Аксессуары для бассейнов Вид Инструменты для уборки бассейнов | * Loss: sentence_transformers_training.model.matryoshka2d_loss.RZTKMatryoshka2dLoss with these parameters: ```json { "loss": "RZTKMultipleNegativesRankingLoss", "n_layers_per_step": 1, "last_layer_weight": 1.0, "prior_layers_weight": 1.0, "kl_div_weight": 1.0, "kl_temperature": 0.3, "matryoshka_dims": [ 768, 512, 256, 128 ], "matryoshka_weights": [ 1, 1, 1, 1 ], "n_dims_per_step": 1 } ``` ### Training Hyperparameters #### Non-Default Hyperparameters - `eval_strategy`: steps - `per_device_train_batch_size`: 80 - `per_device_eval_batch_size`: 16 - `learning_rate`: 2e-05 - `num_train_epochs`: 1.0 - `warmup_ratio`: 0.1 - `bf16`: True - `bf16_full_eval`: True - `tf32`: True - `dataloader_num_workers`: 4 - `load_best_model_at_end`: True - `optim`: adafactor - `push_to_hub`: True - `hub_model_id`: yklymchuk-rztk/multiple-datasets-e5-jina-mnr-1-resume - `hub_private_repo`: True - `prompts`: {'query': 'query: ', 'text': 'passage: '} - `batch_sampler`: no_duplicates #### All Hyperparameters
Click to expand - `overwrite_output_dir`: False - `do_predict`: False - `eval_strategy`: steps - `prediction_loss_only`: True - `per_device_train_batch_size`: 80 - `per_device_eval_batch_size`: 16 - `per_gpu_train_batch_size`: None - `per_gpu_eval_batch_size`: None - `gradient_accumulation_steps`: 1 - `eval_accumulation_steps`: None - `torch_empty_cache_steps`: None - `learning_rate`: 2e-05 - `weight_decay`: 0.0 - `adam_beta1`: 0.9 - `adam_beta2`: 0.999 - `adam_epsilon`: 1e-08 - `max_grad_norm`: 1.0 - `num_train_epochs`: 1.0 - `max_steps`: -1 - `lr_scheduler_type`: linear - `lr_scheduler_kwargs`: {} - `warmup_ratio`: 0.1 - `warmup_steps`: 0 - `log_level`: passive - `log_level_replica`: warning - `log_on_each_node`: True - `logging_nan_inf_filter`: True - `save_safetensors`: True - `save_on_each_node`: False - `save_only_model`: False - `restore_callback_states_from_checkpoint`: False - `no_cuda`: False - `use_cpu`: False - `use_mps_device`: False - `seed`: 42 - `data_seed`: None - `jit_mode_eval`: False - `use_ipex`: False - `bf16`: True - `fp16`: False - `fp16_opt_level`: O1 - `half_precision_backend`: auto - `bf16_full_eval`: True - `fp16_full_eval`: False - `tf32`: True - `local_rank`: 0 - `ddp_backend`: None - `tpu_num_cores`: None - `tpu_metrics_debug`: False - `debug`: [] - `dataloader_drop_last`: True - `dataloader_num_workers`: 4 - `dataloader_prefetch_factor`: None - `past_index`: -1 - `disable_tqdm`: False - `remove_unused_columns`: True - `label_names`: None - `load_best_model_at_end`: True - `ignore_data_skip`: False - `fsdp`: [] - `fsdp_min_num_params`: 0 - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} - `fsdp_transformer_layer_cls_to_wrap`: None - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} - `deepspeed`: None - `label_smoothing_factor`: 0.0 - `optim`: adafactor - `optim_args`: None - `adafactor`: False - `group_by_length`: False - `length_column_name`: length - `ddp_find_unused_parameters`: None - `ddp_bucket_cap_mb`: None - `ddp_broadcast_buffers`: False - `dataloader_pin_memory`: True - `dataloader_persistent_workers`: False - `skip_memory_metrics`: True - `use_legacy_prediction_loop`: False - `push_to_hub`: True - `resume_from_checkpoint`: None - `hub_model_id`: yklymchuk-rztk/multiple-datasets-e5-jina-mnr-1-resume - `hub_strategy`: every_save - `hub_private_repo`: True - `hub_always_push`: False - `gradient_checkpointing`: False - `gradient_checkpointing_kwargs`: None - `include_inputs_for_metrics`: False - `include_for_metrics`: [] - `eval_do_concat_batches`: True - `fp16_backend`: auto - `push_to_hub_model_id`: None - `push_to_hub_organization`: None - `mp_parameters`: - `auto_find_batch_size`: False - `full_determinism`: False - `torchdynamo`: None - `ray_scope`: last - `ddp_timeout`: 1800 - `torch_compile`: False - `torch_compile_backend`: None - `torch_compile_mode`: None - `dispatch_batches`: None - `split_batches`: None - `include_tokens_per_second`: False - `include_num_input_tokens_seen`: False - `neftune_noise_alpha`: None - `optim_target_modules`: None - `batch_eval_metrics`: False - `eval_on_start`: False - `use_liger_kernel`: False - `eval_use_gather_object`: False - `average_tokens_across_devices`: False - `prompts`: {'query': 'query: ', 'text': 'passage: '} - `batch_sampler`: no_duplicates - `multi_dataset_batch_sampler`: proportional - `ddp_static_graph`: False - `ddp_comm_hook`: bf16 - `gradient_as_bucket_view`: False - `num_proc`: 30
### Training Logs | Epoch | Step | Training Loss | core-uk_dot_ndcg_10 | core-ru_dot_ndcg_10 | typos-uk_dot_ndcg_10 | typos-ru_dot_ndcg_10 | transliterations-uk_dot_ndcg_10 | transliterations-ru_dot_ndcg_10 | options-uk_dot_ndcg_10 | options-ru_dot_ndcg_10 | rusisms-uk_dot_ndcg_10 | rusisms-ru_dot_ndcg_10 | jargonisms-uk_dot_ndcg_10 | jargonisms-ru_dot_ndcg_10 | vespa-uk_dot_ndcg_10 | vespa-ru_dot_ndcg_10 | core-uk--matryoshka_dim-768--_dot_ndcg_1 | core-ru--matryoshka_dim-768--_dot_ndcg_1 | typos-uk--matryoshka_dim-768--_dot_ndcg_1 | typos-ru--matryoshka_dim-768--_dot_ndcg_1 | transliterations-uk--matryoshka_dim-768--_dot_ndcg_1 | transliterations-ru--matryoshka_dim-768--_dot_ndcg_1 | options-uk--matryoshka_dim-768--_dot_ndcg_1 | options-ru--matryoshka_dim-768--_dot_ndcg_1 | rusisms-uk--matryoshka_dim-768--_dot_ndcg_1 | rusisms-ru--matryoshka_dim-768--_dot_ndcg_1 | jargonisms-uk--matryoshka_dim-768--_dot_ndcg_1 | jargonisms-ru--matryoshka_dim-768--_dot_ndcg_1 | vespa-uk--matryoshka_dim-768--_dot_ndcg_1 | vespa-ru--matryoshka_dim-768--_dot_ndcg_1 | core-uk--matryoshka_dim-512--_dot_ndcg_1 | core-ru--matryoshka_dim-512--_dot_ndcg_1 | typos-uk--matryoshka_dim-512--_dot_ndcg_1 | typos-ru--matryoshka_dim-512--_dot_ndcg_1 | transliterations-uk--matryoshka_dim-512--_dot_ndcg_1 | transliterations-ru--matryoshka_dim-512--_dot_ndcg_1 | options-uk--matryoshka_dim-512--_dot_ndcg_1 | options-ru--matryoshka_dim-512--_dot_ndcg_1 | rusisms-uk--matryoshka_dim-512--_dot_ndcg_1 | rusisms-ru--matryoshka_dim-512--_dot_ndcg_1 | jargonisms-uk--matryoshka_dim-512--_dot_ndcg_1 | jargonisms-ru--matryoshka_dim-512--_dot_ndcg_1 | vespa-uk--matryoshka_dim-512--_dot_ndcg_1 | vespa-ru--matryoshka_dim-512--_dot_ndcg_1 | core-uk--matryoshka_dim-256--_dot_ndcg_1 | core-ru--matryoshka_dim-256--_dot_ndcg_1 | typos-uk--matryoshka_dim-256--_dot_ndcg_1 | typos-ru--matryoshka_dim-256--_dot_ndcg_1 | transliterations-uk--matryoshka_dim-256--_dot_ndcg_1 | transliterations-ru--matryoshka_dim-256--_dot_ndcg_1 | options-uk--matryoshka_dim-256--_dot_ndcg_1 | options-ru--matryoshka_dim-256--_dot_ndcg_1 | rusisms-uk--matryoshka_dim-256--_dot_ndcg_1 | rusisms-ru--matryoshka_dim-256--_dot_ndcg_1 | jargonisms-uk--matryoshka_dim-256--_dot_ndcg_1 | jargonisms-ru--matryoshka_dim-256--_dot_ndcg_1 | vespa-uk--matryoshka_dim-256--_dot_ndcg_1 | vespa-ru--matryoshka_dim-256--_dot_ndcg_1 | core-uk--matryoshka_dim-128--_dot_ndcg_1 | core-ru--matryoshka_dim-128--_dot_ndcg_1 | typos-uk--matryoshka_dim-128--_dot_ndcg_1 | typos-ru--matryoshka_dim-128--_dot_ndcg_1 | transliterations-uk--matryoshka_dim-128--_dot_ndcg_1 | transliterations-ru--matryoshka_dim-128--_dot_ndcg_1 | options-uk--matryoshka_dim-128--_dot_ndcg_1 | options-ru--matryoshka_dim-128--_dot_ndcg_1 | rusisms-uk--matryoshka_dim-128--_dot_ndcg_1 | rusisms-ru--matryoshka_dim-128--_dot_ndcg_1 | jargonisms-uk--matryoshka_dim-128--_dot_ndcg_1 | jargonisms-ru--matryoshka_dim-128--_dot_ndcg_1 | vespa-uk--matryoshka_dim-128--_dot_ndcg_1 | vespa-ru--matryoshka_dim-128--_dot_ndcg_1 | |:------:|:------:|:-------------:|:-------------------:|:-------------------:|:--------------------:|:--------------------:|:-------------------------------:|:-------------------------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:-------------------------:|:-------------------------:|:--------------------:|:--------------------:|:----------------------------------------:|:----------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------------------:|:----------------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:----------------------------------------------:|:----------------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------:|:----------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------------------:|:----------------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:----------------------------------------------:|:----------------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------:|:----------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------------------:|:----------------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:----------------------------------------------:|:----------------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------:|:----------------------------------------:|:-----------------------------------------:|:-----------------------------------------:|:----------------------------------------------------:|:----------------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:-------------------------------------------:|:----------------------------------------------:|:----------------------------------------------:|:-----------------------------------------:|:-----------------------------------------:| | 0.9001 | 226080 | 1.0602 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9051 | 227336 | 1.086 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9101 | 228592 | 1.1007 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9151 | 229848 | 1.0864 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9201 | 231104 | 1.0742 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9251 | 232360 | 1.3858 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9301 | 233616 | 1.6237 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9351 | 234872 | 1.3967 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9401 | 236128 | 1.3071 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9451 | 237384 | 1.2582 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9501 | 238640 | 1.2381 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9551 | 239896 | 1.218 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9601 | 241152 | 1.1881 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9651 | 242408 | 1.2221 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9701 | 243664 | 1.2178 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9751 | 244920 | 1.2269 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9801 | 246176 | 1.2132 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9851 | 247432 | 1.2221 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9901 | 248688 | 1.2326 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9951 | 249944 | 1.1998 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | | 0.9998 | 251127 | - | 0.5995 | 0.5999 | 0.5811 | 0.5799 | 0.5090 | 0.5144 | 0.5858 | 0.5877 | 0.8346 | 0.8299 | 0.7774 | 0.7743 | 0.7717 | 0.7605 | 0.8320 | 0.8346 | 0.7927 | 0.7966 | 0.7662 | 0.7794 | 0.8447 | 0.8495 | 0.9341 | 0.9341 | 0.8974 | 0.8974 | 0.8696 | 0.8370 | 0.8215 | 0.8189 | 0.7795 | 0.7782 | 0.7516 | 0.7655 | 0.8398 | 0.8398 | 0.9451 | 0.9451 | 0.8974 | 0.8974 | 0.8478 | 0.8478 | 0.8123 | 0.8123 | 0.7822 | 0.7743 | 0.7225 | 0.7334 | 0.8398 | 0.8374 | 0.9451 | 0.9341 | 0.8974 | 0.9231 | 0.8587 | 0.8370 | 0.7979 | 0.7835 | 0.7546 | 0.7598 | 0.6654 | 0.6778 | 0.8107 | 0.8180 | 0.9231 | 0.9231 | 0.8718 | 0.8974 | 0.8370 | 0.8261 | ### Framework Versions - Python: 3.11.10 - Sentence Transformers: 3.3.0 - Transformers: 4.46.3 - PyTorch: 2.5.1+cu124 - Accelerate: 1.1.1 - Datasets: 3.1.0 - Tokenizers: 0.20.3 ## Citation ### BibTeX #### Sentence Transformers ```bibtex @inproceedings{reimers-2019-sentence-bert, title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", author = "Reimers, Nils and Gurevych, Iryna", booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", month = "11", year = "2019", publisher = "Association for Computational Linguistics", url = "https://arxiv.org/abs/1908.10084", } ```