compressa-ai
/

Llama-3-70B-Instruct-OmniQuant

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-3-70B-Instruct-OmniQuant

File size: 63 Bytes

1f3dc6b

{"wbits": 4, "abits": 16, "group_size": 128, "symmetric": true}