File size: 910 Bytes
32741ef a33f5e3 476aa6f 43a459f |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
---
license: apache-2.0
datasets:
- IlyaGusev/habr
language:
- ru
- en
library_name: transformers
---
# Vikhr: модель на базе Mistral для русского языка
Введение в Vikhr: представляем Vikhr, основанную на архитектуре Mistral и предварительно обученную на 400 миллионах токенов в течение трех эпох.
Она должна быть лучше чем оригинальный мистраль на русских задачах, а вот с кодом скорее всего будут проблемы.
## Бенчи
| Датасет | Vikhr-7b-0.1 | Mistral-7B-v0.1 |
|--------------|--------------|-----------------|
| mmlu_ru | 0.60 | 0.66 |
| xwinograd | 0.72 | 0.68 |
| xnli | 0.3812 | 0.3691 |
|