Synthyra
/

ESM2-3B

lhallee commited on 12 days ago

Commit

601fa2b

verified ·

1 Parent(s): 1ffa8b1

Upload modeling_fastesm.py with huggingface_hub

Files changed (1) hide show

modeling_fastesm.py CHANGED Viewed

@@ -55,7 +55,12 @@ class FastEsmConfig(PretrainedConfig):
         emb_layer_norm_before: bool = None,
         **kwargs,
     ):
-        super().__init__(pad_token_id=pad_token_id, mask_token_id=mask_token_id, **kwargs)
         self.vocab_size = vocab_size
         self.hidden_size = hidden_size
@@ -945,8 +950,6 @@ class FastEsmModel(FastEsmPreTrainedModel, EmbeddingMixin):
 class FastEsmForMaskedLM(FastEsmPreTrainedModel, EmbeddingMixin):
-    _tied_weights_keys = ["lm_head.decoder.weight"]
     def __init__(self, config, **kwargs):
         FastEsmPreTrainedModel.__init__(self, config, **kwargs)
         self.esm = FAST_ESM_ENCODER(config, add_pooling_layer=False)

         emb_layer_norm_before: bool = None,
         **kwargs,
     ):
+        super().__init__(
+            pad_token_id=pad_token_id,
+            mask_token_id=mask_token_id,
+            tie_word_embeddings=False,
+            **kwargs,
+        )
         self.vocab_size = vocab_size
         self.hidden_size = hidden_size
 class FastEsmForMaskedLM(FastEsmPreTrainedModel, EmbeddingMixin):
     def __init__(self, config, **kwargs):
         FastEsmPreTrainedModel.__init__(self, config, **kwargs)
         self.esm = FAST_ESM_ENCODER(config, add_pooling_layer=False)