Vikhrmodels
/

QVikhr-2.5-1.5B-Instruct-SMPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

LakoMoor commited on Feb 3

Commit

7058f8d

·

verified ·

1 Parent(s): 6ea2c28

Update README.md

Files changed (1) hide show

README.md +5 -0

README.md CHANGED Viewed

@@ -27,6 +27,11 @@ license: apache-2.0
 **QVikhr-2.5-1.5B-Instruct-SMPO** представляет собой языковую модель, прошедшую специализированное обучение с использованием метода **SMPO**. Эта модель демонстрирует прогресс в методах выравнивания, особенно в области улучшения качества ответов через оптимизацию предпочтений.
 ## Обучение:
 ### Этап алайнмента с SMPO (Simple Margin Preference Optimization)

 **QVikhr-2.5-1.5B-Instruct-SMPO** представляет собой языковую модель, прошедшую специализированное обучение с использованием метода **SMPO**. Эта модель демонстрирует прогресс в методах выравнивания, особенно в области улучшения качества ответов через оптимизацию предпочтений.
+## Попробовать / Try now:
+[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/drive/1xpTj8gLZAl2kbgciEAP9XxF5G18f7znr?usp=sharing)
 ## Обучение:
 ### Этап алайнмента с SMPO (Simple Margin Preference Optimization)