Text Generation
GGUF
Russian
Inference Endpoints
conversational

Улучшение карточки модели

#1
by JohnConnor123 - opened

Привет, спасибо за твою работу)
Было бы круто добавить таблицу зависимости max VRAM от разной квантизации как у bartowski. А так же насколько сильно влияет квантизация (например q5-q6) на способность к мышлению на русском у этой модели (и если изучал вопрос, то какое влияние способностью к мыслям на русском при квантизации всяких llama/mistral)?

Sign up or log in to comment