Set main branch to 4bit-128g-True, sharded

Browse files

Files changed (14) hide show

ACCEPTABLE_USE_POLICY.txt +11 -0
config.json +2 -4
model-00001-of-00010.safetensors +2 -2
model-00002-of-00010.safetensors +2 -2
model-00003-of-00010.safetensors +2 -2
model-00004-of-00010.safetensors +2 -2
model-00005-of-00010.safetensors +2 -2
model-00006-of-00010.safetensors +2 -2
model-00007-of-00010.safetensors +2 -2
model-00008-of-00010.safetensors +2 -2
model-00009-of-00010.safetensors +2 -2
model-00010-of-00010.safetensors +2 -2
model.safetensors.index.json +478 -478
quantize_config.json +2 -2

ACCEPTABLE_USE_POLICY.txt ADDED Viewed

	@@ -0,0 +1,11 @@

+FALCON 180B TII LICENSE VERSION 1.0
+September 2023
+falconllm.tii.ae
+ACCEPTABLE USE POLICY
+You agree not to use Falcon 180B or any Work or Derivative Work (as such terms are defined in the Falcon 180B TII License Version 1.0):
+	1.	In any way that violates any applicable national, federal, state, local or international law or regulation;
+	2.	For the purpose of exploiting, harming or attempting to exploit or harm minors and/or living beings in any way;
+	3.	To generate or disseminate verifiably false information with the purpose of harming others; and/or
+	4.	To defame, disparage or otherwise harass others.

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "/workspace/falcon-180b-chat-gptq-main",
   "alibi": false,
   "architectures": [
     "FalconForCausalLM"
@@ -19,9 +19,7 @@
   "num_attention_heads": 232,
   "num_hidden_layers": 80,
   "num_kv_heads": 8,
-  "pad_token_id": 0,
   "parallel_attn": true,
-  "pretraining_tp": 1,
   "quantization_config": {
     "batch_size": 1,
     "bits": 4,
@@ -30,7 +28,7 @@
     "dataset": null,
     "desc_act": true,
     "disable_exllama": true,
-    "group_size": -1,
     "model_seqlen": null,
     "module_name_preceding_first_block": null,
     "pad_token_id": null,

 {
+  "_name_or_path": "/workspace/process/tiiuae_falcon-180b-chat/gptq/gptq-4bit-128g-actorder_True/",
   "alibi": false,
   "architectures": [
     "FalconForCausalLM"
   "num_attention_heads": 232,
   "num_hidden_layers": 80,
   "num_kv_heads": 8,
   "parallel_attn": true,
   "quantization_config": {
     "batch_size": 1,
     "bits": 4,
     "dataset": null,
     "desc_act": true,
     "disable_exllama": true,
+    "group_size": 128,
     "model_seqlen": null,
     "module_name_preceding_first_block": null,
     "pad_token_id": null,

model-00001-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5e8bf5c1009b25e46f741620de1b8c8a73602142d5d3aa4ec24d576543155cc
-size 9935767728

 version https://git-lfs.github.com/spec/v1
+oid sha256:0710855b0308e1a37410e6b67253974815c0f97d5c303d03e1132ab7ad7c55f7
+size 9995023968

model-00002-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:462411c384834e128a4f1fbd438affe13809414a8e89c0bb718e80a16801af9b
-size 9998346208

 version https://git-lfs.github.com/spec/v1
+oid sha256:7ecbfc54c8304049dd69afd6280886fad89bc7e566f5b9570749e4be935448f6
+size 9941818992

model-00003-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f691d9791f30c094520c5992c075c16dd6c520c4aedc515acda6e717cdce9037
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:f3568ba7cefbf02ad057e9a32e1f883b13ec912ff79ef511b3f589451cd2106f
+size 9927772520

model-00004-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0efec866ce1e79013384d7d29d0024aa057e0b39a7f93654fd6c25f15ab53a54
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:f6d8e65ea85221c1b8ce251bec6ea9e5b498ccf2f4677f59faa8a6b54869be4a
+size 9690586856

model-00005-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e5b6e177ab2f0ed6fbc9f1cdd57a15d605922a485d689400df86095c6441fb39
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:fca596b681e4541b2d1e168ecceb3f2fa2b675ee9ace856032ac6c26f104e795
+size 9927772520

model-00006-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f81daa26794d5fdcdcff501bc79a90395098343b38eab7311f148a044a217fbe
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:d73cd57d08723ae9efc442bae774702b518ab65c6fcbdfc35637dd2f9d791538
+size 9690586856

model-00007-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7b9275ba2740935b4c633508616cce85491987108ded36bcf2268facb53d2189
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:1cf2e1595288202bdf9abcf4bfc14cb8f6142466adf1a1e9c64df19cf1367dfe
+size 9927772520

model-00008-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e80780d21e54a97cea05312881287afa1b3bc1ed9656de691abf2e07861a3e27
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b60dff7f3adf1fb7f49aa484ffc6d13f797acd61865bf9a1270e6f368f354f6
+size 9690586856

model-00009-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2ef0141399c5e1811aa5f0c30b63648fa93ab0de21481cf8533511c307b2f3b2
-size 9998346272

 version https://git-lfs.github.com/spec/v1
+oid sha256:09092c16c2675c5d1621dda898f57aa9b6a6fb10c39a7baa9a3db35a5c1d8cdd
+size 9927772520

model-00010-of-00010.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:10573cdffc16b8c5bcbcec75d45959b6e3d68af756aa76d7c70d1fb06619ef55
-size 882663400

 version https://git-lfs.github.com/spec/v1
+oid sha256:5724bbe7696a4281087fd85831fc8fa6489117332176c9243145d4b424aab3a7
+size 5533009736

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 90804975616
   },
   "weight_map": {
     "transformer.h.0.ln_attn.bias": "model-00001-of-00010.safetensors",
@@ -171,20 +171,20 @@
     "transformer.h.14.self_attention.query_key_value.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.14.self_attention.query_key_value.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.14.self_attention.query_key_value.scales": "model-00002-of-00010.safetensors",
-    "transformer.h.15.ln_attn.bias": "model-00002-of-00010.safetensors",
-    "transformer.h.15.ln_attn.weight": "model-00002-of-00010.safetensors",
-    "transformer.h.15.ln_mlp.bias": "model-00002-of-00010.safetensors",
-    "transformer.h.15.ln_mlp.weight": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.bias": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.g_idx": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.scales": "model-00002-of-00010.safetensors",
-    "transformer.h.15.mlp.dense_h_to_4h.bias": "model-00002-of-00010.safetensors",
-    "transformer.h.15.mlp.dense_h_to_4h.g_idx": "model-00002-of-00010.safetensors",
-    "transformer.h.15.mlp.dense_h_to_4h.qweight": "model-00002-of-00010.safetensors",
-    "transformer.h.15.mlp.dense_h_to_4h.qzeros": "model-00002-of-00010.safetensors",
-    "transformer.h.15.mlp.dense_h_to_4h.scales": "model-00002-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.bias": "model-00002-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.g_idx": "model-00002-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.qweight": "model-00002-of-00010.safetensors",
@@ -209,16 +209,16 @@
     "transformer.h.16.mlp.dense_h_to_4h.qweight": "model-00003-of-00010.safetensors",
     "transformer.h.16.mlp.dense_h_to_4h.qzeros": "model-00003-of-00010.safetensors",
     "transformer.h.16.mlp.dense_h_to_4h.scales": "model-00003-of-00010.safetensors",
-    "transformer.h.16.self_attention.dense.bias": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.dense.g_idx": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.dense.qweight": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.dense.qzeros": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.dense.scales": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.query_key_value.bias": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.query_key_value.g_idx": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.query_key_value.qweight": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.query_key_value.qzeros": "model-00002-of-00010.safetensors",
-    "transformer.h.16.self_attention.query_key_value.scales": "model-00002-of-00010.safetensors",
     "transformer.h.17.ln_attn.bias": "model-00003-of-00010.safetensors",
     "transformer.h.17.ln_attn.weight": "model-00003-of-00010.safetensors",
     "transformer.h.17.ln_mlp.bias": "model-00003-of-00010.safetensors",
@@ -411,20 +411,20 @@
     "transformer.h.23.self_attention.query_key_value.qweight": "model-00003-of-00010.safetensors",
     "transformer.h.23.self_attention.query_key_value.qzeros": "model-00003-of-00010.safetensors",
     "transformer.h.23.self_attention.query_key_value.scales": "model-00003-of-00010.safetensors",
-    "transformer.h.24.ln_attn.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.24.ln_attn.weight": "model-00003-of-00010.safetensors",
-    "transformer.h.24.ln_mlp.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.24.ln_mlp.weight": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_4h_to_h.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_4h_to_h.g_idx": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_4h_to_h.qweight": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_4h_to_h.qzeros": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_4h_to_h.scales": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_h_to_4h.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_h_to_4h.g_idx": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_h_to_4h.qweight": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_h_to_4h.qzeros": "model-00003-of-00010.safetensors",
-    "transformer.h.24.mlp.dense_h_to_4h.scales": "model-00003-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.bias": "model-00003-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.g_idx": "model-00003-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.qweight": "model-00003-of-00010.safetensors",
@@ -449,16 +449,16 @@
     "transformer.h.25.mlp.dense_h_to_4h.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.25.mlp.dense_h_to_4h.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.25.mlp.dense_h_to_4h.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.25.self_attention.dense.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.dense.g_idx": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.dense.qweight": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.dense.qzeros": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.dense.scales": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.query_key_value.bias": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.query_key_value.g_idx": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.query_key_value.qweight": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.query_key_value.qzeros": "model-00003-of-00010.safetensors",
-    "transformer.h.25.self_attention.query_key_value.scales": "model-00003-of-00010.safetensors",
     "transformer.h.26.ln_attn.bias": "model-00004-of-00010.safetensors",
     "transformer.h.26.ln_attn.weight": "model-00004-of-00010.safetensors",
     "transformer.h.26.ln_mlp.bias": "model-00004-of-00010.safetensors",
@@ -627,20 +627,20 @@
     "transformer.h.31.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.31.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.31.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.32.ln_attn.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.32.ln_attn.weight": "model-00004-of-00010.safetensors",
-    "transformer.h.32.ln_mlp.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.32.ln_mlp.weight": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.bias": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.g_idx": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.32.mlp.dense_h_to_4h.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.32.mlp.dense_h_to_4h.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.32.mlp.dense_h_to_4h.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.32.mlp.dense_h_to_4h.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.32.mlp.dense_h_to_4h.scales": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.bias": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.g_idx": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.qweight": "model-00004-of-00010.safetensors",
@@ -651,30 +651,30 @@
     "transformer.h.32.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.33.ln_attn.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.ln_attn.weight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.ln_mlp.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.ln_mlp.weight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_4h_to_h.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_4h_to_h.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_4h_to_h.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_4h_to_h.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_4h_to_h.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_h_to_4h.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_h_to_4h.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_h_to_4h.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_h_to_4h.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.33.mlp.dense_h_to_4h.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.dense.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.dense.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.dense.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.dense.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.dense.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.query_key_value.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.query_key_value.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.33.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
     "transformer.h.34.ln_attn.bias": "model-00005-of-00010.safetensors",
     "transformer.h.34.ln_attn.weight": "model-00005-of-00010.safetensors",
     "transformer.h.34.ln_mlp.bias": "model-00005-of-00010.safetensors",
@@ -689,16 +689,16 @@
     "transformer.h.34.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.34.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.34.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.34.self_attention.dense.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.dense.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.dense.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.dense.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.dense.scales": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.query_key_value.bias": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.query_key_value.g_idx": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
-    "transformer.h.34.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
     "transformer.h.35.ln_attn.bias": "model-00005-of-00010.safetensors",
     "transformer.h.35.ln_attn.weight": "model-00005-of-00010.safetensors",
     "transformer.h.35.ln_mlp.bias": "model-00005-of-00010.safetensors",
@@ -867,20 +867,20 @@
     "transformer.h.40.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.40.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.40.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.41.ln_attn.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.41.ln_attn.weight": "model-00005-of-00010.safetensors",
-    "transformer.h.41.ln_mlp.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.41.ln_mlp.weight": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_4h_to_h.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_4h_to_h.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_4h_to_h.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_4h_to_h.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_4h_to_h.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_h_to_4h.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_h_to_4h.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.41.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.bias": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
@@ -891,30 +891,30 @@
     "transformer.h.41.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.42.ln_attn.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.ln_attn.weight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.ln_mlp.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.ln_mlp.weight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_4h_to_h.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_4h_to_h.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_4h_to_h.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_4h_to_h.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_4h_to_h.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_h_to_4h.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_h_to_4h.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.42.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.dense.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.dense.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.dense.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.query_key_value.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.query_key_value.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.42.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
     "transformer.h.43.ln_attn.bias": "model-00006-of-00010.safetensors",
     "transformer.h.43.ln_attn.weight": "model-00006-of-00010.safetensors",
     "transformer.h.43.ln_mlp.bias": "model-00006-of-00010.safetensors",
@@ -929,16 +929,16 @@
     "transformer.h.43.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.43.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.43.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.43.self_attention.dense.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.dense.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.dense.scales": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.query_key_value.bias": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.query_key_value.g_idx": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
-    "transformer.h.43.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
     "transformer.h.44.ln_attn.bias": "model-00006-of-00010.safetensors",
     "transformer.h.44.ln_attn.weight": "model-00006-of-00010.safetensors",
     "transformer.h.44.ln_mlp.bias": "model-00006-of-00010.safetensors",
@@ -1059,20 +1059,20 @@
     "transformer.h.48.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.48.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.48.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.49.ln_attn.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.49.ln_attn.weight": "model-00006-of-00010.safetensors",
-    "transformer.h.49.ln_mlp.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.49.ln_mlp.weight": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.49.mlp.dense_h_to_4h.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.49.mlp.dense_h_to_4h.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.49.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.49.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.49.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.bias": "model-00006-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
@@ -1107,54 +1107,54 @@
     "transformer.h.5.self_attention.query_key_value.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.5.self_attention.query_key_value.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.5.self_attention.query_key_value.scales": "model-00001-of-00010.safetensors",
-    "transformer.h.50.ln_attn.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.ln_attn.weight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.ln_mlp.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.ln_mlp.weight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_h_to_4h.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_h_to_4h.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.50.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.dense.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.dense.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.dense.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.query_key_value.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.query_key_value.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.50.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.51.ln_attn.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.ln_attn.weight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.ln_mlp.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.ln_mlp.weight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_h_to_4h.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_h_to_4h.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.51.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.dense.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.dense.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.dense.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.query_key_value.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.query_key_value.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.51.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
     "transformer.h.52.ln_attn.bias": "model-00007-of-00010.safetensors",
     "transformer.h.52.ln_attn.weight": "model-00007-of-00010.safetensors",
     "transformer.h.52.ln_mlp.bias": "model-00007-of-00010.safetensors",
@@ -1169,16 +1169,16 @@
     "transformer.h.52.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.52.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.52.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.52.self_attention.dense.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.dense.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.dense.scales": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.query_key_value.bias": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.query_key_value.g_idx": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
-    "transformer.h.52.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
     "transformer.h.53.ln_attn.bias": "model-00007-of-00010.safetensors",
     "transformer.h.53.ln_attn.weight": "model-00007-of-00010.safetensors",
     "transformer.h.53.ln_mlp.bias": "model-00007-of-00010.safetensors",
@@ -1299,20 +1299,20 @@
     "transformer.h.57.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.57.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.57.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.58.ln_attn.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.58.ln_attn.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.58.ln_mlp.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.58.ln_mlp.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_4h_to_h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_4h_to_h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_4h_to_h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_4h_to_h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_4h_to_h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.58.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.bias": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
@@ -1323,44 +1323,44 @@
     "transformer.h.58.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.59.ln_attn.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.ln_attn.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.ln_mlp.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.ln_mlp.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_4h_to_h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_4h_to_h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_4h_to_h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_4h_to_h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_4h_to_h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.59.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.dense.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.dense.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.59.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.6.ln_attn.bias": "model-00001-of-00010.safetensors",
-    "transformer.h.6.ln_attn.weight": "model-00001-of-00010.safetensors",
-    "transformer.h.6.ln_mlp.bias": "model-00001-of-00010.safetensors",
-    "transformer.h.6.ln_mlp.weight": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.bias": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.g_idx": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.scales": "model-00001-of-00010.safetensors",
-    "transformer.h.6.mlp.dense_h_to_4h.bias": "model-00001-of-00010.safetensors",
-    "transformer.h.6.mlp.dense_h_to_4h.g_idx": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_h_to_4h.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_h_to_4h.qzeros": "model-00001-of-00010.safetensors",
-    "transformer.h.6.mlp.dense_h_to_4h.scales": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.bias": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.g_idx": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.qweight": "model-00001-of-00010.safetensors",
@@ -1371,30 +1371,30 @@
     "transformer.h.6.self_attention.query_key_value.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.query_key_value.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.query_key_value.scales": "model-00001-of-00010.safetensors",
-    "transformer.h.60.ln_attn.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.ln_attn.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.ln_mlp.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.ln_mlp.weight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_4h_to_h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_4h_to_h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_4h_to_h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_4h_to_h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_4h_to_h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.60.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.dense.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.dense.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.60.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
     "transformer.h.61.ln_attn.bias": "model-00008-of-00010.safetensors",
     "transformer.h.61.ln_attn.weight": "model-00008-of-00010.safetensors",
     "transformer.h.61.ln_mlp.bias": "model-00008-of-00010.safetensors",
@@ -1409,16 +1409,16 @@
     "transformer.h.61.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.61.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.61.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.61.self_attention.dense.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.dense.scales": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
-    "transformer.h.61.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
     "transformer.h.62.ln_attn.bias": "model-00008-of-00010.safetensors",
     "transformer.h.62.ln_attn.weight": "model-00008-of-00010.safetensors",
     "transformer.h.62.ln_mlp.bias": "model-00008-of-00010.safetensors",
@@ -1515,20 +1515,20 @@
     "transformer.h.65.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.65.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.65.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.66.ln_attn.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.66.ln_attn.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.66.ln_mlp.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.66.ln_mlp.weight": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.66.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.66.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.66.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.66.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.66.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.bias": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
@@ -1539,78 +1539,78 @@
     "transformer.h.66.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.67.ln_attn.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.ln_attn.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.ln_mlp.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.ln_mlp.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.67.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.dense.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.dense.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.67.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.68.ln_attn.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.ln_attn.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.ln_mlp.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.ln_mlp.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.68.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.dense.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.dense.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.68.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.69.ln_attn.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.ln_attn.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.ln_mlp.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.ln_mlp.weight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.69.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.dense.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.dense.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.69.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
     "transformer.h.7.ln_attn.bias": "model-00002-of-00010.safetensors",
     "transformer.h.7.ln_attn.weight": "model-00002-of-00010.safetensors",
     "transformer.h.7.ln_mlp.bias": "model-00002-of-00010.safetensors",
@@ -1625,16 +1625,16 @@
     "transformer.h.7.mlp.dense_h_to_4h.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.7.mlp.dense_h_to_4h.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.7.mlp.dense_h_to_4h.scales": "model-00002-of-00010.safetensors",
-    "transformer.h.7.self_attention.dense.bias": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.dense.g_idx": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.dense.qweight": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.dense.qzeros": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.dense.scales": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.query_key_value.bias": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.query_key_value.g_idx": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.query_key_value.qweight": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.query_key_value.qzeros": "model-00001-of-00010.safetensors",
-    "transformer.h.7.self_attention.query_key_value.scales": "model-00001-of-00010.safetensors",
     "transformer.h.70.ln_attn.bias": "model-00009-of-00010.safetensors",
     "transformer.h.70.ln_attn.weight": "model-00009-of-00010.safetensors",
     "transformer.h.70.ln_mlp.bias": "model-00009-of-00010.safetensors",
@@ -1649,16 +1649,16 @@
     "transformer.h.70.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.70.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.70.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.70.self_attention.dense.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.dense.scales": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
-    "transformer.h.70.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
     "transformer.h.71.ln_attn.bias": "model-00009-of-00010.safetensors",
     "transformer.h.71.ln_attn.weight": "model-00009-of-00010.safetensors",
     "transformer.h.71.ln_mlp.bias": "model-00009-of-00010.safetensors",
@@ -1755,20 +1755,20 @@
     "transformer.h.74.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.74.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.74.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.75.ln_attn.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.75.ln_attn.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.75.ln_mlp.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.75.ln_mlp.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.75.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.bias": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
@@ -1779,78 +1779,78 @@
     "transformer.h.75.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.76.ln_attn.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.ln_attn.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.ln_mlp.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.ln_mlp.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.76.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.dense.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.dense.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.76.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.77.ln_attn.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.ln_attn.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.ln_mlp.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.ln_mlp.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.77.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.dense.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.dense.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.77.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.78.ln_attn.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.ln_attn.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.ln_mlp.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.ln_mlp.weight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.78.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.dense.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.dense.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.78.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
     "transformer.h.79.ln_attn.bias": "model-00010-of-00010.safetensors",
     "transformer.h.79.ln_attn.weight": "model-00010-of-00010.safetensors",
     "transformer.h.79.ln_mlp.bias": "model-00010-of-00010.safetensors",
@@ -1865,16 +1865,16 @@
     "transformer.h.79.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
     "transformer.h.79.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
     "transformer.h.79.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
-    "transformer.h.79.self_attention.dense.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.dense.scales": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
-    "transformer.h.79.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
     "transformer.h.8.ln_attn.bias": "model-00002-of-00010.safetensors",
     "transformer.h.8.ln_attn.weight": "model-00002-of-00010.safetensors",
     "transformer.h.8.ln_mlp.bias": "model-00002-of-00010.safetensors",

 {
   "metadata": {
+    "total_size": 94252476416
   },
   "weight_map": {
     "transformer.h.0.ln_attn.bias": "model-00001-of-00010.safetensors",
     "transformer.h.14.self_attention.query_key_value.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.14.self_attention.query_key_value.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.14.self_attention.query_key_value.scales": "model-00002-of-00010.safetensors",
+    "transformer.h.15.ln_attn.bias": "model-00003-of-00010.safetensors",
+    "transformer.h.15.ln_attn.weight": "model-00003-of-00010.safetensors",
+    "transformer.h.15.ln_mlp.bias": "model-00003-of-00010.safetensors",
+    "transformer.h.15.ln_mlp.weight": "model-00003-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.bias": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.g_idx": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.15.mlp.dense_4h_to_h.scales": "model-00002-of-00010.safetensors",
+    "transformer.h.15.mlp.dense_h_to_4h.bias": "model-00003-of-00010.safetensors",
+    "transformer.h.15.mlp.dense_h_to_4h.g_idx": "model-00003-of-00010.safetensors",
+    "transformer.h.15.mlp.dense_h_to_4h.qweight": "model-00003-of-00010.safetensors",
+    "transformer.h.15.mlp.dense_h_to_4h.qzeros": "model-00003-of-00010.safetensors",
+    "transformer.h.15.mlp.dense_h_to_4h.scales": "model-00003-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.bias": "model-00002-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.g_idx": "model-00002-of-00010.safetensors",
     "transformer.h.15.self_attention.dense.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.16.mlp.dense_h_to_4h.qweight": "model-00003-of-00010.safetensors",
     "transformer.h.16.mlp.dense_h_to_4h.qzeros": "model-00003-of-00010.safetensors",
     "transformer.h.16.mlp.dense_h_to_4h.scales": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.dense.bias": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.dense.g_idx": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.dense.qweight": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.dense.qzeros": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.dense.scales": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.query_key_value.bias": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.query_key_value.g_idx": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.query_key_value.qweight": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.query_key_value.qzeros": "model-00003-of-00010.safetensors",
+    "transformer.h.16.self_attention.query_key_value.scales": "model-00003-of-00010.safetensors",
     "transformer.h.17.ln_attn.bias": "model-00003-of-00010.safetensors",
     "transformer.h.17.ln_attn.weight": "model-00003-of-00010.safetensors",
     "transformer.h.17.ln_mlp.bias": "model-00003-of-00010.safetensors",
     "transformer.h.23.self_attention.query_key_value.qweight": "model-00003-of-00010.safetensors",
     "transformer.h.23.self_attention.query_key_value.qzeros": "model-00003-of-00010.safetensors",
     "transformer.h.23.self_attention.query_key_value.scales": "model-00003-of-00010.safetensors",
+    "transformer.h.24.ln_attn.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.24.ln_attn.weight": "model-00004-of-00010.safetensors",
+    "transformer.h.24.ln_mlp.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.24.ln_mlp.weight": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_4h_to_h.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_4h_to_h.g_idx": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_4h_to_h.qweight": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_4h_to_h.qzeros": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_4h_to_h.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_h_to_4h.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_h_to_4h.g_idx": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_h_to_4h.qweight": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_h_to_4h.qzeros": "model-00004-of-00010.safetensors",
+    "transformer.h.24.mlp.dense_h_to_4h.scales": "model-00004-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.bias": "model-00003-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.g_idx": "model-00003-of-00010.safetensors",
     "transformer.h.24.self_attention.dense.qweight": "model-00003-of-00010.safetensors",
     "transformer.h.25.mlp.dense_h_to_4h.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.25.mlp.dense_h_to_4h.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.25.mlp.dense_h_to_4h.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.dense.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.dense.g_idx": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.dense.qweight": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.dense.qzeros": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.dense.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.query_key_value.bias": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.query_key_value.g_idx": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
+    "transformer.h.25.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
     "transformer.h.26.ln_attn.bias": "model-00004-of-00010.safetensors",
     "transformer.h.26.ln_attn.weight": "model-00004-of-00010.safetensors",
     "transformer.h.26.ln_mlp.bias": "model-00004-of-00010.safetensors",
     "transformer.h.31.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.31.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.31.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.32.ln_attn.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.32.ln_attn.weight": "model-00005-of-00010.safetensors",
+    "transformer.h.32.ln_mlp.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.32.ln_mlp.weight": "model-00005-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.bias": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.g_idx": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.32.mlp.dense_4h_to_h.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.32.mlp.dense_h_to_4h.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.32.mlp.dense_h_to_4h.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.32.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.32.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.32.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.bias": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.g_idx": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.dense.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.query_key_value.qweight": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.query_key_value.qzeros": "model-00004-of-00010.safetensors",
     "transformer.h.32.self_attention.query_key_value.scales": "model-00004-of-00010.safetensors",
+    "transformer.h.33.ln_attn.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.ln_attn.weight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.ln_mlp.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.ln_mlp.weight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_4h_to_h.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_4h_to_h.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_4h_to_h.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_4h_to_h.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_4h_to_h.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_h_to_4h.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_h_to_4h.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.33.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.dense.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.dense.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.dense.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.query_key_value.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.query_key_value.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.33.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
     "transformer.h.34.ln_attn.bias": "model-00005-of-00010.safetensors",
     "transformer.h.34.ln_attn.weight": "model-00005-of-00010.safetensors",
     "transformer.h.34.ln_mlp.bias": "model-00005-of-00010.safetensors",
     "transformer.h.34.mlp.dense_h_to_4h.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.34.mlp.dense_h_to_4h.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.34.mlp.dense_h_to_4h.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.dense.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.dense.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.dense.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.query_key_value.bias": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.query_key_value.g_idx": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
+    "transformer.h.34.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
     "transformer.h.35.ln_attn.bias": "model-00005-of-00010.safetensors",
     "transformer.h.35.ln_attn.weight": "model-00005-of-00010.safetensors",
     "transformer.h.35.ln_mlp.bias": "model-00005-of-00010.safetensors",
     "transformer.h.40.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.40.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.40.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.41.ln_attn.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.41.ln_attn.weight": "model-00006-of-00010.safetensors",
+    "transformer.h.41.ln_mlp.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.41.ln_mlp.weight": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_h_to_4h.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_h_to_4h.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.41.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.bias": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.g_idx": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.dense.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.query_key_value.qweight": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.query_key_value.qzeros": "model-00005-of-00010.safetensors",
     "transformer.h.41.self_attention.query_key_value.scales": "model-00005-of-00010.safetensors",
+    "transformer.h.42.ln_attn.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.ln_attn.weight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.ln_mlp.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.ln_mlp.weight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_h_to_4h.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_h_to_4h.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.42.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.dense.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.dense.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.dense.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.query_key_value.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.query_key_value.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.42.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
     "transformer.h.43.ln_attn.bias": "model-00006-of-00010.safetensors",
     "transformer.h.43.ln_attn.weight": "model-00006-of-00010.safetensors",
     "transformer.h.43.ln_mlp.bias": "model-00006-of-00010.safetensors",
     "transformer.h.43.mlp.dense_h_to_4h.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.43.mlp.dense_h_to_4h.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.43.mlp.dense_h_to_4h.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.dense.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.dense.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.dense.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.query_key_value.bias": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.query_key_value.g_idx": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
+    "transformer.h.43.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
     "transformer.h.44.ln_attn.bias": "model-00006-of-00010.safetensors",
     "transformer.h.44.ln_attn.weight": "model-00006-of-00010.safetensors",
     "transformer.h.44.ln_mlp.bias": "model-00006-of-00010.safetensors",
     "transformer.h.48.self_attention.query_key_value.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.48.self_attention.query_key_value.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.48.self_attention.query_key_value.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.49.ln_attn.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.49.ln_attn.weight": "model-00007-of-00010.safetensors",
+    "transformer.h.49.ln_mlp.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.49.ln_mlp.weight": "model-00007-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.bias": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.g_idx": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.qzeros": "model-00006-of-00010.safetensors",
     "transformer.h.49.mlp.dense_4h_to_h.scales": "model-00006-of-00010.safetensors",
+    "transformer.h.49.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.49.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.49.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.49.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.49.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.bias": "model-00006-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.g_idx": "model-00006-of-00010.safetensors",
     "transformer.h.49.self_attention.dense.qweight": "model-00006-of-00010.safetensors",
     "transformer.h.5.self_attention.query_key_value.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.5.self_attention.query_key_value.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.5.self_attention.query_key_value.scales": "model-00001-of-00010.safetensors",
+    "transformer.h.50.ln_attn.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.ln_attn.weight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.ln_mlp.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.ln_mlp.weight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_4h_to_h.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_4h_to_h.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_4h_to_h.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_4h_to_h.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_4h_to_h.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.50.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.dense.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.dense.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.50.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.51.ln_attn.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.ln_attn.weight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.ln_mlp.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.ln_mlp.weight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_4h_to_h.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_4h_to_h.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_4h_to_h.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_4h_to_h.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_4h_to_h.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_h_to_4h.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_h_to_4h.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.51.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.dense.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.dense.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.51.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
     "transformer.h.52.ln_attn.bias": "model-00007-of-00010.safetensors",
     "transformer.h.52.ln_attn.weight": "model-00007-of-00010.safetensors",
     "transformer.h.52.ln_mlp.bias": "model-00007-of-00010.safetensors",
     "transformer.h.52.mlp.dense_h_to_4h.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.52.mlp.dense_h_to_4h.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.52.mlp.dense_h_to_4h.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.dense.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.dense.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.dense.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.query_key_value.bias": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.query_key_value.g_idx": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
+    "transformer.h.52.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
     "transformer.h.53.ln_attn.bias": "model-00007-of-00010.safetensors",
     "transformer.h.53.ln_attn.weight": "model-00007-of-00010.safetensors",
     "transformer.h.53.ln_mlp.bias": "model-00007-of-00010.safetensors",
     "transformer.h.57.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.57.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.57.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.58.ln_attn.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.58.ln_attn.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.58.ln_mlp.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.58.ln_mlp.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.58.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.bias": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.g_idx": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.dense.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.query_key_value.qweight": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.query_key_value.qzeros": "model-00007-of-00010.safetensors",
     "transformer.h.58.self_attention.query_key_value.scales": "model-00007-of-00010.safetensors",
+    "transformer.h.59.ln_attn.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.ln_attn.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.ln_mlp.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.ln_mlp.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.59.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.dense.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.dense.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.59.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.6.ln_attn.bias": "model-00002-of-00010.safetensors",
+    "transformer.h.6.ln_attn.weight": "model-00002-of-00010.safetensors",
+    "transformer.h.6.ln_mlp.bias": "model-00002-of-00010.safetensors",
+    "transformer.h.6.ln_mlp.weight": "model-00002-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.bias": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.g_idx": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_4h_to_h.scales": "model-00001-of-00010.safetensors",
+    "transformer.h.6.mlp.dense_h_to_4h.bias": "model-00002-of-00010.safetensors",
+    "transformer.h.6.mlp.dense_h_to_4h.g_idx": "model-00002-of-00010.safetensors",
     "transformer.h.6.mlp.dense_h_to_4h.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.mlp.dense_h_to_4h.qzeros": "model-00001-of-00010.safetensors",
+    "transformer.h.6.mlp.dense_h_to_4h.scales": "model-00002-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.bias": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.g_idx": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.dense.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.query_key_value.qweight": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.query_key_value.qzeros": "model-00001-of-00010.safetensors",
     "transformer.h.6.self_attention.query_key_value.scales": "model-00001-of-00010.safetensors",
+    "transformer.h.60.ln_attn.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.ln_attn.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.ln_mlp.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.ln_mlp.weight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_h_to_4h.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_h_to_4h.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.60.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.dense.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.dense.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.60.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
     "transformer.h.61.ln_attn.bias": "model-00008-of-00010.safetensors",
     "transformer.h.61.ln_attn.weight": "model-00008-of-00010.safetensors",
     "transformer.h.61.ln_mlp.bias": "model-00008-of-00010.safetensors",
     "transformer.h.61.mlp.dense_h_to_4h.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.61.mlp.dense_h_to_4h.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.61.mlp.dense_h_to_4h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.dense.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.dense.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.dense.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.query_key_value.bias": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.query_key_value.g_idx": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
+    "transformer.h.61.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
     "transformer.h.62.ln_attn.bias": "model-00008-of-00010.safetensors",
     "transformer.h.62.ln_attn.weight": "model-00008-of-00010.safetensors",
     "transformer.h.62.ln_mlp.bias": "model-00008-of-00010.safetensors",
     "transformer.h.65.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.65.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.65.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.66.ln_attn.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.66.ln_attn.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.66.ln_mlp.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.66.ln_mlp.weight": "model-00009-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.bias": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.g_idx": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.66.mlp.dense_4h_to_h.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.66.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.66.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.66.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.66.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.66.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.bias": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.g_idx": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.dense.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.query_key_value.qweight": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.query_key_value.qzeros": "model-00008-of-00010.safetensors",
     "transformer.h.66.self_attention.query_key_value.scales": "model-00008-of-00010.safetensors",
+    "transformer.h.67.ln_attn.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.ln_attn.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.ln_mlp.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.ln_mlp.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.67.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.dense.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.dense.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.67.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.68.ln_attn.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.ln_attn.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.ln_mlp.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.ln_mlp.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.68.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.dense.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.dense.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.68.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.69.ln_attn.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.ln_attn.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.ln_mlp.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.ln_mlp.weight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_4h_to_h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_4h_to_h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_4h_to_h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_4h_to_h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_4h_to_h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_h_to_4h.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_h_to_4h.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.69.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.dense.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.dense.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.69.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
     "transformer.h.7.ln_attn.bias": "model-00002-of-00010.safetensors",
     "transformer.h.7.ln_attn.weight": "model-00002-of-00010.safetensors",
     "transformer.h.7.ln_mlp.bias": "model-00002-of-00010.safetensors",
     "transformer.h.7.mlp.dense_h_to_4h.qweight": "model-00002-of-00010.safetensors",
     "transformer.h.7.mlp.dense_h_to_4h.qzeros": "model-00002-of-00010.safetensors",
     "transformer.h.7.mlp.dense_h_to_4h.scales": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.dense.bias": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.dense.g_idx": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.dense.qweight": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.dense.qzeros": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.dense.scales": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.query_key_value.bias": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.query_key_value.g_idx": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.query_key_value.qweight": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.query_key_value.qzeros": "model-00002-of-00010.safetensors",
+    "transformer.h.7.self_attention.query_key_value.scales": "model-00002-of-00010.safetensors",
     "transformer.h.70.ln_attn.bias": "model-00009-of-00010.safetensors",
     "transformer.h.70.ln_attn.weight": "model-00009-of-00010.safetensors",
     "transformer.h.70.ln_mlp.bias": "model-00009-of-00010.safetensors",
     "transformer.h.70.mlp.dense_h_to_4h.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.70.mlp.dense_h_to_4h.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.70.mlp.dense_h_to_4h.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.dense.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.dense.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.dense.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.query_key_value.bias": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.query_key_value.g_idx": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
+    "transformer.h.70.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
     "transformer.h.71.ln_attn.bias": "model-00009-of-00010.safetensors",
     "transformer.h.71.ln_attn.weight": "model-00009-of-00010.safetensors",
     "transformer.h.71.ln_mlp.bias": "model-00009-of-00010.safetensors",
     "transformer.h.74.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.74.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.74.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.75.ln_attn.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.75.ln_attn.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.75.ln_mlp.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.75.ln_mlp.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_4h_to_h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_4h_to_h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_4h_to_h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_4h_to_h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_4h_to_h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_h_to_4h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_h_to_4h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.75.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.bias": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.g_idx": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.dense.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.query_key_value.qweight": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.query_key_value.qzeros": "model-00009-of-00010.safetensors",
     "transformer.h.75.self_attention.query_key_value.scales": "model-00009-of-00010.safetensors",
+    "transformer.h.76.ln_attn.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.ln_attn.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.ln_mlp.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.ln_mlp.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_4h_to_h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_4h_to_h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_4h_to_h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_4h_to_h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_4h_to_h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_h_to_4h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_h_to_4h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.76.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.dense.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.dense.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.dense.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.dense.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.dense.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.query_key_value.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.query_key_value.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.query_key_value.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.query_key_value.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.76.self_attention.query_key_value.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.77.ln_attn.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.ln_attn.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.ln_mlp.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.ln_mlp.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_4h_to_h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_4h_to_h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_4h_to_h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_4h_to_h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_4h_to_h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_h_to_4h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_h_to_4h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.77.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.dense.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.dense.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.dense.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.dense.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.dense.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.query_key_value.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.query_key_value.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.query_key_value.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.query_key_value.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.77.self_attention.query_key_value.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.78.ln_attn.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.ln_attn.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.ln_mlp.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.ln_mlp.weight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_4h_to_h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_4h_to_h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_4h_to_h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_4h_to_h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_4h_to_h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_h_to_4h.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_h_to_4h.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.78.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.dense.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.dense.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.dense.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.dense.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.dense.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.query_key_value.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.query_key_value.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.query_key_value.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.query_key_value.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.78.self_attention.query_key_value.scales": "model-00010-of-00010.safetensors",
     "transformer.h.79.ln_attn.bias": "model-00010-of-00010.safetensors",
     "transformer.h.79.ln_attn.weight": "model-00010-of-00010.safetensors",
     "transformer.h.79.ln_mlp.bias": "model-00010-of-00010.safetensors",
     "transformer.h.79.mlp.dense_h_to_4h.qweight": "model-00010-of-00010.safetensors",
     "transformer.h.79.mlp.dense_h_to_4h.qzeros": "model-00010-of-00010.safetensors",
     "transformer.h.79.mlp.dense_h_to_4h.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.dense.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.dense.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.dense.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.dense.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.dense.scales": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.query_key_value.bias": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.query_key_value.g_idx": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.query_key_value.qweight": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.query_key_value.qzeros": "model-00010-of-00010.safetensors",
+    "transformer.h.79.self_attention.query_key_value.scales": "model-00010-of-00010.safetensors",
     "transformer.h.8.ln_attn.bias": "model-00002-of-00010.safetensors",
     "transformer.h.8.ln_attn.weight": "model-00002-of-00010.safetensors",
     "transformer.h.8.ln_mlp.bias": "model-00002-of-00010.safetensors",

quantize_config.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
   "bits": 4,
-  "group_size": -1,
   "damp_percent": 0.1,
   "desc_act": true,
   "sym": true,
   "true_sequential": true,
   "model_name_or_path": null,
   "model_file_base_name": "model"
-}

 {
   "bits": 4,
+  "group_size": 128,
   "damp_percent": 0.1,
   "desc_act": true,
   "sym": true,
   "true_sequential": true,
   "model_name_or_path": null,
   "model_file_base_name": "model"
+}