ISTA-DASLab
/

Meta-Llama-3-8B-Instruct-AQLM-2Bit-1x16

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-AQLM-2Bit-1x16

3 contributors

History: 5 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Added more evaluations

90f515b verified 10 months ago

.gitattributes

1.52 kB

initial commit 10 months ago
README.md

745 Bytes

Added more evaluations 10 months ago
config.json

4.34 kB

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago
generation_config.json

126 Bytes

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago
model.safetensors

4.08 GB
LFS

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago
special_tokens_map.json

73 Bytes

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago
tokenizer.json

9.08 MB

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago
tokenizer_config.json

50.6 kB

Uploaded Meta-Llama-3-8B-Instruct with AQLM 1x16 quantization 10 months ago