ISTA-DASLab
/

Llama-2-7b-AQLM-2Bit-8x8-hf

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

Model card Files Files and versions Community

Llama-2-7b-AQLM-2Bit-8x8-hf

3 contributors

History: 6 commits

SpiridonSunRotator's picture

SpiridonSunRotator

Update README.md

cefe7f7 verified 10 months ago

.gitattributes

1.52 kB

initial commit 11 months ago
README.md

1.66 kB

Update README.md 10 months ago
config.json

2.5 kB

everything 11 months ago
configuration_llama_aqlm.py

421 Bytes

everything 11 months ago
modeling_llama_aqlm.py

65.5 kB

everything 11 months ago
pytorch_model.bin
Detected Pickle imports (4)
- "torch.CharStorage",
- "torch._utils._rebuild_tensor_v2",
- "collections.OrderedDict",
- "torch.HalfStorage"
What is a pickle import?
2.18 GB
LFS

Upload pytorch_model.bin with huggingface_hub 10 months ago