CCRss
/

Llama-3.1-Nemotron-70B-Instruct-HF-calib-original_pileval_en_AWQ-4bit-g128-gemm

4-bit precision

Model card Files Files and versions Community

CCRss commited on Nov 13, 2024

Commit

edcff9d

·

verified ·

1 Parent(s): f75f20c

Create README.md

Files changed (1) hide show

README.md +6 -0

README.md ADDED Viewed

	@@ -0,0 +1,6 @@

+quant_config = {
+    "zero_point": True,
+    "q_group_size": 128,
+    "w_bit": 4,
+    "version": "GEMM"
+}