emozilla
/

landmark-llama-7b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

viktoroo commited on Aug 1, 2024

Commit

62e1d0e

·

verified ·

1 Parent(s): 8e7b4ae

Update modelling_landmark_llama.py

Files changed (1) hide show

modelling_landmark_llama.py +4 -2

modelling_landmark_llama.py CHANGED Viewed

@@ -32,6 +32,8 @@ from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import add_start_docstrings, add_start_docstrings_to_model_forward, logging, replace_return_docstrings
 from transformers.models.llama.configuration_llama import LlamaConfig
 logger = logging.get_logger(__name__)
@@ -565,7 +567,7 @@ LLAMA_START_DOCSTRING = r"""
     LLAMA_START_DOCSTRING,
 )
 class LlamaPreTrainedModel(PreTrainedModel):
-    config_class = LlamaConfig
     base_model_prefix = "model"
     supports_gradient_checkpointing = True
     _no_split_modules = ["LlamaDecoderLayer"]
@@ -873,7 +875,7 @@ class LlamaModel(LlamaPreTrainedModel):
 class LlamaForCausalLM(LlamaPreTrainedModel):
-    def __init__(self, config):
         super().__init__(config)
         self.model = LlamaModel(config)

 from transformers.utils import add_start_docstrings, add_start_docstrings_to_model_forward, logging, replace_return_docstrings
 from transformers.models.llama.configuration_llama import LlamaConfig
+from configuration_landmark_llama import LlamaConfig as LandmarkLlamaConfig
 logger = logging.get_logger(__name__)
     LLAMA_START_DOCSTRING,
 )
 class LlamaPreTrainedModel(PreTrainedModel):
+    config_class = LandmarkLlamaConfig
     base_model_prefix = "model"
     supports_gradient_checkpointing = True
     _no_split_modules = ["LlamaDecoderLayer"]
 class LlamaForCausalLM(LlamaPreTrainedModel):
+    def __init__(self, config: LandmarkLlamaConfig):
         super().__init__(config)
         self.model = LlamaModel(config)