ecker
/

vall-e

ecker commited on Nov 2

Commit

2e4dbd6

•

1 Parent(s): 57122c7

Upload 2 files

Very early layerskip-aware weights

Files changed (3) hide show

.gitattributes CHANGED Viewed

@@ -17,3 +17,4 @@ loras/ckpt/lora-cyberpunk-silverhand-r128-a128/lora.sft filter=lfs diff=lfs merg
 loras/ckpt/lora-cyberpunk-takemura-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text
 loras/ckpt/lora-portal-glados-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text
 loras/ckpt/lora-samandmax-sam-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text

 loras/ckpt/lora-cyberpunk-takemura-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text
 loras/ckpt/lora-portal-glados-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text
 loras/ckpt/lora-samandmax-sam-r128-a128/lora.sft filter=lfs diff=lfs merge=lfs -text
+models/ckpt/ar+nar-layerskip-llama-8/fp32.sft filter=lfs diff=lfs merge=lfs -text

models/ckpt/ar+nar-layerskip-llama-8/fp32.sft ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:232e0cec837102824e5d8b19cd4d3a138566aa7b9f048fa7c48049c5398e0677
+size 456274634

models/config.llama[layerskip].yaml ADDED Viewed

+models:
+- name: "ar+nar-layerskip"
+  size: "full"
+  resp_levels: 8
+  tasks: 9
+  langs: 4
+  tones: 1
+  arch_type: llama
+  attention: auto
+  version: 5
+  capabilities: ["ar", "nar"]
+  experimental:
+    split_classifiers: True
+    audio_embedding_sums: True
+    unified_position_ids: False
+    layerskip: True