AQLM - a ISTA-DASLab Collection

ISTA-DASLab 's Collections

QuEST

HIGGS

AQLM+PV

AQLM

AQLM

updated about 13 hours ago

AQLM quantized LLMs

Extreme Compression of Large Language Models via Additive Quantization

Paper • 2401.06118 • Published Jan 11, 2024 • 12
ISTA-DASLab/Meta-Llama-3-70B-Instruct-AQLM-2Bit-1x16

Text Generation • Updated May 13, 2024 • 160 • 20
ISTA-DASLab/Meta-Llama-3-70B-AQLM-2Bit-1x16

Text Generation • Updated May 4, 2024 • 22 • 14
ISTA-DASLab/Meta-Llama-3-8B-Instruct-AQLM-2Bit-1x16

Text Generation • Updated Nov 8, 2024 • 241 • 12
ISTA-DASLab/Meta-Llama-3-8B-AQLM-2Bit-1x16

Text Generation • Updated Jul 2, 2024 • 235 • 7
ISTA-DASLab/c4ai-command-r-v01-AQLM-2Bit-1x16

Text Generation • Updated Apr 13, 2024 • 22 • 10
ISTA-DASLab/c4ai-command-r-plus-AQLM-2Bit-1x16

Text Generation • Updated Apr 21, 2024 • 24 • 10
ISTA-DASLab/Mixtral-8x7B-Instruct-v0_1-AQLM-2Bit-1x16-hf

Text Generation • Updated Feb 27, 2024 • 49 • 18
ISTA-DASLab/Mixtral-8x7b-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 11, 2024 • 80 • 23
ISTA-DASLab/Mistral-7B-Instruct-v0.2-AQLM-2Bit-2x8

Text Generation • Updated Apr 13, 2024 • 21 • 3
ISTA-DASLab/Mistral-7B-v0.1-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 11, 2024 • 81 • 2
ISTA-DASLab/gemma-2b-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 10, 2024 • 90 • 6
ISTA-DASLab/gemma-2b-AQLM-2Bit-2x8-hf

Text Generation • Updated Mar 10, 2024 • 94 • 4
ISTA-DASLab/Llama-2-7b-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 11, 2024 • 11.2k • 5
ISTA-DASLab/Llama-2-7b-AQLM-2Bit-2x8-hf

Text Generation • Updated Mar 11, 2024 • 49 • 2
ISTA-DASLab/Llama-2-7b-AQLM-2Bit-8x8-hf

Text Generation • Updated Mar 11, 2024 • 36
ISTA-DASLab/Llama-2-13b-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 11, 2024 • 30
ISTA-DASLab/Llama-2-13b-AQLM-4Bit-2x16-hf

Text Generation • Updated Feb 10, 2024 • 19
ISTA-DASLab/Llama-2-70b-AQLM-2Bit-1x16-hf

Text Generation • Updated Mar 11, 2024 • 59 • 6
ISTA-DASLab/Llama-2-70b-AQLM-2Bit-2x8-hf

Text Generation • Updated Mar 11, 2024 • 25 • 1
ISTA-DASLab/Llama-2-70b-AQLM-4Bit-2x16-hf

Text Generation • Updated Feb 10, 2024 • 22