Vikhrmodels
/

QVikhr-2.5-1.5B-Instruct-SMPO_GGUF

Inference Endpoints

Model card Files Files and versions Community

QVikhr-2.5-1.5B-Instruct-SMPO_GGUF / README.md

WaveCut's picture

Update README.md

01da8f5 verified 16 days ago

|

history blame contribute delete

1.9 kB

	---
	base_model:
	- Vikhrmodels/QVikhr-2.5-1.5B-Instruct-SMPO
	language:
	- ru
	- en
	license: apache-2.0
	library:
	library_name: llamacpp
	---

	# 💨🦅 QVikhr-2.5-1.5B-Instruct-SMPO

	Инструктивная модель на основе Qwen-2.5-1.5B-Instruct, обученная на русскоязычном датасете GrandMaster-PRO-MAX с использованием SMPO (Simple Margin Preference Optimization).

	## Описание:

	QVikhr-2.5-1.5B-Instruct-SMPO представляет собой языковую модель, прошедшую специализированное обучение с использованием метода SMPO. Эта модель демонстрирует прогресс в методах выравнивания, особенно в области улучшения качества ответов через оптимизацию предпочтений.

	# Transformers
	- [QVikhr-2.5-1.5B-Instruct-SMPO](https://hf.co/Vikhrmodels/QVikhr-2.5-1.5B-Instruct-SMPO)

	### Авторы

	- Sergei Bratchikov, [NLP Wanderer](https://t.me/nlpwanderer), [Vikhr Team](https://t.me/vikhrlabs)
	- Nikolay Kompanets, [LakoMoor](https://t.me/lakomoordev), [Vikhr Team](https://t.me/vikhrlabs)
	- Konstantin Korolev, [Vikhr Team](https://t.me/vikhrlabs)
	- Aleksandr Nikolich, [Vikhr Team](https://t.me/vikhrlabs)

	```
	@inproceedings{nikolich2024vikhr,
	title={Vikhr: Advancing Open-Source Bilingual Instruction-Following Large Language Models for Russian and English},
	author={Aleksandr Nikolich and Konstantin Korolev and Sergei Bratchikov and Nikolay Kompanets and Igor Kiselev and Artem Shelmanov},
	booktitle={Proceedings of the 4th Workshop on Multilingual Representation Learning (MRL) @ EMNLP-2024},
	year={2024},
	publisher={Association for Computational Linguistics},
	url={https://arxiv.org/pdf/2405.13929}
	}
	```