Улучшение карточки модели
#1
by
JohnConnor123
- opened
Привет, спасибо за твою работу)
Было бы круто добавить таблицу зависимости max VRAM от разной квантизации как у bartowski. А так же насколько сильно влияет квантизация (например q5-q6) на способность к мышлению на русском у этой модели (и если изучал вопрос, то какое влияние способностью к мыслям на русском при квантизации всяких llama/mistral)?