Upload folder using huggingface_hub

Files changed (12) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,12 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q2_K.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q2_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:eca4a474f91a58f66d98eada50af48c715138281b47702012ab487d2dcbc4a5d
+size 17309173632

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_L.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c7225885266a271d812a36cac6d0e49aef3a749ea7c0af209c69014e30a801f
+size 24167589760

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f60f83fef0331f687ae96ddf2ca236076a88cbedd538a24bd6fc963548f7bc6
+size 22544394112

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q3_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:37a3111e71569db4b69c67a1102272eb5440f774ce459215ff38ec3b0252c4b6
+size 20430464896

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q4_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:953a5de56d3bcfe55d42db6685a63048570aec32c8dd5525c3b3c0747163b646
+size 28446410624

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q4_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a81c311a65a720b848d28df1906212f5c6102a2b4c6523dd83e83512051b93e9
+size 26743523200

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q5_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a53ba1a31bd2f92006247844056d854521df0664320b9810fd548d07491fd49
+size 33227523968

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q5_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1f4e9eb6f1689f3f23e5ae6cc92361914b802b5c4115a480a82fd06478c8f859
+size 32229279616

Air-Striker-Mixtral-8x7B-Instruct-ZLoss-Q6_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3338d30dc991ac026f0d10d45a1e89662b6e278dfb3ae79c0acb962d31e041b6
+size 38378760064

README.md ADDED Viewed

+---
+inference: false
+language:
+- en
+library_name: transformers
+pipeline_tag: text-generation
+tags:
+- mixtral
+- mergekit
+- merge
+license: apache-2.0
+datasets:
+- jondurbin/airoboros-3.2
+---
+# Air-Striker-Mixtral-8x7B-Instruct-ZLoss
+Experimental model, trained using config and [Transformers/Axolotl](https://github.com/DocShotgun/axolotl) forks provided by [Doctor-Shotgun](https://huggingface.co/Doctor-Shotgun)
+Model was fine-tuned from [Mixtral-8x7B-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-v0.1) with airoboros-3.2 dataset, for 4 epochs, ChatML prompt format at 8K context length.
+Additionally, model was then merged with [Mixtral-8x7B-Instruct-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1):
+---
+This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
+## Merge Details
+### Merge Method
+This model was merged using the [linear](https://arxiv.org/abs/2203.05482) merge method.
+### Models Merged
+The following models were included in the merge:
+* mistralai/Mixtral-8x7B-Instruct-v0.1
+* LoneStriker/Air-Striker-Mixtral-8x7B-ZLoss
+### Configuration
+The following YAML configuration was used to produce this model:
+```yaml
+models:
+  - model: mistralai/Mixtral-8x7B-Instruct-v0.1
+    parameters:
+      weight: 0.5
+  - model: LoneStriker/Air-Striker-Mixtral-8x7B-ZLoss
+    parameters:
+      weight: 0.5
+merge_method: linear
+dtype: bfloat16
+```

mergekit_config.yml ADDED Viewed

+models:
+  - model: mistralai/Mixtral-8x7B-Instruct-v0.1
+    parameters:
+      weight: 0.5
+  - model: LoneStriker/Air-Striker-Mixtral-8x7B-ZLoss
+    parameters:
+      weight: 0.5
+merge_method: linear
+dtype: bfloat16