jbrinkma
/

TinyModel_L0_Transcoder

Model card Files Files and versions Community

jbrinkma commited on Nov 19, 2024

Commit

69f8c98

·

verified ·

1 Parent(s): 6ae6cad

Upload folder using huggingface_hub

Files changed (7) hide show

trainer_0/ae.pt +3 -0
trainer_0/checkpoints/ae_0.pt +3 -0
trainer_0/checkpoints/ae_2048.pt +3 -0
trainer_0/checkpoints/ae_4096.pt +3 -0
trainer_0/checkpoints/ae_6144.pt +3 -0
trainer_0/checkpoints/ae_8192.pt +3 -0
trainer_0/config.json +26 -0

trainer_0/ae.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa5b042410ca433993da3c045d335629be860addc634ac735fef049b1d3b51e1
+size 37778216

trainer_0/checkpoints/ae_0.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7335e86afac341439c6a69f5c1e31c93d8127a0ddf4120ae80add272d8f154a0
+size 37778232

trainer_0/checkpoints/ae_2048.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f7e7a42a0c59172ed870e81ed34a33d87157cc4802fd2e47fafd87bb4341ed61
+size 37778320

trainer_0/checkpoints/ae_4096.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a8966e001b92231fe9a2522cd98d567bd1408ced454aa344ed88bc3682cfd754
+size 37778320

trainer_0/checkpoints/ae_6144.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a707603ac4cc676352e30373934986dbba01cf6ce5ffb1fb21e0aa6f2520c578
+size 37778320

trainer_0/checkpoints/ae_8192.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:08a4730f06b0fcd73260090f42b63e9c881b9f8d191a002c6cb570e22f07f1d5
+size 37778320

trainer_0/config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "trainer": {
+        "trainer_class": "TrainerTopK",
+        "dict_class": "AutoEncoderTopK",
+        "lr": 0.00032659863237109043,
+        "steps": 30000,
+        "seed": null,
+        "activation_dim": 768,
+        "dict_size": 6144,
+        "k": 30,
+        "device": "cuda",
+        "layer": "0",
+        "lm_name": "TinyModel_2L_3E",
+        "wandb_name": "AutoEncoderTopK",
+        "submodule_name": null
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 30000.0,
+        "ctx_len": 128,
+        "refresh_batch_size": 512,
+        "out_batch_size": 8192,
+        "device": "cuda"
+    }
+}