neuralmagic
/

gemma-2-2b-it-quantized.w8a8

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions Community

alexmarques commited on Aug 16, 2024

Commit

0e84fac

·

verified ·

1 Parent(s): 2d65072

Update README.md

Files changed (1) hide show

README.md +1 -0

README.md CHANGED Viewed

@@ -4,6 +4,7 @@ tags:
 - int8
 - vllm
 license: gemma
 ---
 # gemma-2-2b-it-quantized.w8a8

 - int8
 - vllm
 license: gemma
+base_model: google/gemma-2-2b-it
 ---
 # gemma-2-2b-it-quantized.w8a8