adamkarvonen
/

temp

adamkarvonen commited on Feb 16

Commit

04904c9

verified ·

1 Parent(s): 08d00c9

Add files using upload-large-folder tool

Files changed (10) hide show

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_1/ae.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0456e8f89a7d8e8b0c9f459266cd5abeca34e88aa0dfe25d99f115cc35bae4fd
+size 100733608

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_1/config.json ADDED Viewed

+{
+    "trainer": {
+        "dict_class": "AutoEncoder",
+        "trainer_class": "StandardTrainerAprilUpdate",
+        "activation_dim": 768,
+        "dict_size": 16384,
+        "lr": 0.0003,
+        "l1_penalty": 0.015,
+        "warmup_steps": 1000,
+        "sparsity_warmup_steps": 5000,
+        "steps": 244140,
+        "decay_start": 195312,
+        "seed": 0,
+        "device": "cuda:0",
+        "layer": 8,
+        "lm_name": "EleutherAI/pythia-160m-deduped",
+        "wandb_name": "StandardTrainerNew-EleutherAI/pythia-160m-deduped-resid_post_layer_8_trainer_7",
+        "submodule_name": "resid_post_layer_8"
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 244,
+        "ctx_len": 1024,
+        "refresh_batch_size": 32,
+        "out_batch_size": 2048,
+        "device": "cuda:0"
+    }
+}

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_2/ae.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bc63701f51a3105252744651a04ed847cb660b8e15816278c0e1f2237a31ff50
+size 100733608

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_2/config.json ADDED Viewed

+{
+    "trainer": {
+        "dict_class": "AutoEncoder",
+        "trainer_class": "StandardTrainerAprilUpdate",
+        "activation_dim": 768,
+        "dict_size": 16384,
+        "lr": 0.0003,
+        "l1_penalty": 0.02,
+        "warmup_steps": 1000,
+        "sparsity_warmup_steps": 5000,
+        "steps": 244140,
+        "decay_start": 195312,
+        "seed": 0,
+        "device": "cuda:0",
+        "layer": 8,
+        "lm_name": "EleutherAI/pythia-160m-deduped",
+        "wandb_name": "StandardTrainerNew-EleutherAI/pythia-160m-deduped-resid_post_layer_8_trainer_8",
+        "submodule_name": "resid_post_layer_8"
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 244,
+        "ctx_len": 1024,
+        "refresh_batch_size": 32,
+        "out_batch_size": 2048,
+        "device": "cuda:0"
+    }
+}

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_3/ae.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:67e8a04d84460f93f395ba4ff34e01c3326c43f5110610bcdae09b8e6b8fdcdd
+size 100733608

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_3/config.json ADDED Viewed

+{
+    "trainer": {
+        "dict_class": "AutoEncoder",
+        "trainer_class": "StandardTrainerAprilUpdate",
+        "activation_dim": 768,
+        "dict_size": 16384,
+        "lr": 0.0003,
+        "l1_penalty": 0.03,
+        "warmup_steps": 1000,
+        "sparsity_warmup_steps": 5000,
+        "steps": 244140,
+        "decay_start": 195312,
+        "seed": 0,
+        "device": "cuda:0",
+        "layer": 8,
+        "lm_name": "EleutherAI/pythia-160m-deduped",
+        "wandb_name": "StandardTrainerNew-EleutherAI/pythia-160m-deduped-resid_post_layer_8_trainer_9",
+        "submodule_name": "resid_post_layer_8"
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 244,
+        "ctx_len": 1024,
+        "refresh_batch_size": 32,
+        "out_batch_size": 2048,
+        "device": "cuda:0"
+    }
+}

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_4/ae.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:49031f0f47dd040414fc44026679814976a6d1d884fb8884348da9fad02bac7a
+size 100733608

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_4/config.json ADDED Viewed

+{
+    "trainer": {
+        "dict_class": "AutoEncoder",
+        "trainer_class": "StandardTrainerAprilUpdate",
+        "activation_dim": 768,
+        "dict_size": 16384,
+        "lr": 0.0003,
+        "l1_penalty": 0.04,
+        "warmup_steps": 1000,
+        "sparsity_warmup_steps": 5000,
+        "steps": 244140,
+        "decay_start": 195312,
+        "seed": 0,
+        "device": "cuda:0",
+        "layer": 8,
+        "lm_name": "EleutherAI/pythia-160m-deduped",
+        "wandb_name": "StandardTrainerNew-EleutherAI/pythia-160m-deduped-resid_post_layer_8_trainer_10",
+        "submodule_name": "resid_post_layer_8"
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 244,
+        "ctx_len": 1024,
+        "refresh_batch_size": 32,
+        "out_batch_size": 2048,
+        "device": "cuda:0"
+    }
+}

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_5/ae.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7354597a3c4f34d60e64502165ca3b8df5550bc6522ca46681b9b4e75e9a1fe9
+size 100733608

Standard_pythia-160m-deduped__0108-finetune_2pow14/resid_post_layer_8/trainer_5/config.json ADDED Viewed

+{
+    "trainer": {
+        "dict_class": "AutoEncoder",
+        "trainer_class": "StandardTrainerAprilUpdate",
+        "activation_dim": 768,
+        "dict_size": 16384,
+        "lr": 0.0003,
+        "l1_penalty": 0.06,
+        "warmup_steps": 1000,
+        "sparsity_warmup_steps": 5000,
+        "steps": 244140,
+        "decay_start": 195312,
+        "seed": 0,
+        "device": "cuda:0",
+        "layer": 8,
+        "lm_name": "EleutherAI/pythia-160m-deduped",
+        "wandb_name": "StandardTrainerNew-EleutherAI/pythia-160m-deduped-resid_post_layer_8_trainer_11",
+        "submodule_name": "resid_post_layer_8"
+    },
+    "buffer": {
+        "d_submodule": 768,
+        "io": "out",
+        "n_ctxs": 244,
+        "ctx_len": 1024,
+        "refresh_batch_size": 32,
+        "out_batch_size": 2048,
+        "device": "cuda:0"
+    }
+}