Upload folder using huggingface_hub

Browse files

Files changed (3) hide show

modeling_llama_v2.py +0 -1
registry.py +16 -19
utils.py +0 -133

modeling_llama_v2.py CHANGED Viewed

@@ -9,7 +9,6 @@ from transformers.utils import add_start_docstrings_to_model_forward, replace_re
 from transformers.modeling_outputs import CausalLMOutputWithPast
 from transformers.models.llama.modeling_llama import LLAMA_INPUTS_DOCSTRING, _CONFIG_FOR_DOC
 from transformers.models.llama.modeling_llama import LlamaForCausalLM as LlamaForCausalLMOrig
-# from minigpt4_video.models.transformers.src.transformers.models.llama.modeling_llama import LlamaForCausalLM as LlamaForCausalLMOrig
 class LlamaForCausalLM(LlamaForCausalLMOrig):

 from transformers.modeling_outputs import CausalLMOutputWithPast
 from transformers.models.llama.modeling_llama import LLAMA_INPUTS_DOCSTRING, _CONFIG_FOR_DOC
 from transformers.models.llama.modeling_llama import LlamaForCausalLM as LlamaForCausalLMOrig
 class LlamaForCausalLM(LlamaForCausalLMOrig):

registry.py CHANGED Viewed

@@ -26,24 +26,21 @@ class Registry:
         Args:
             name: Key with which the task will be registered.
-        Usage:
-            from minigpt4.common.registry import registry
         """
         def wrap(model_cls):
-            # from minigpt4.models import BaseModel
-            # assert issubclass(
-            #     model_cls, BaseModel
-            # ), "All models must inherit BaseModel class"
-            # if name in cls.mapping["model_name_mapping"]:
-            #     raise KeyError(
-            #         "Name '{}' already registered for {}.".format(
-            #             name, cls.mapping["model_name_mapping"][name]
-            #         )
-            #     )
             cls.mapping["model_name_mapping"][name] = model_cls
             return model_cls
@@ -58,7 +55,7 @@ class Registry:
         Usage:
-            from minigpt4.common.registry import registry
         """
         def wrap(processor_cls):
@@ -87,7 +84,7 @@ class Registry:
         Usage:
-            from minigpt4.common.registry import registry
         """
         def wrap(lr_sched_cls):
@@ -111,7 +108,7 @@ class Registry:
         Usage:
-            from minigpt4.common.registry import registry
         """
         def wrap(runner_cls):
@@ -135,7 +132,7 @@ class Registry:
         Usage:
-            from minigpt4.common.registry import registry
         """
         assert isinstance(path, str), "All path must be str."
         if name in cls.mapping["paths"]:
@@ -151,7 +148,7 @@ class Registry:
         Usage::
-            from minigpt4.common.registry import registry
             registry.register("config", {})
         """
@@ -260,7 +257,7 @@ class Registry:
             name: Key which needs to be removed.
         Usage::
-            from mmf.common.registry import registry
             config = registry.unregister("config")
         """

         Args:
             name: Key with which the task will be registered.
         """
         def wrap(model_cls):
+            from .base_model import BaseModel
+            assert issubclass(
+                model_cls, BaseModel
+            ), "All models must inherit BaseModel class"
+            if name in cls.mapping["model_name_mapping"]:
+                raise KeyError(
+                    "Name '{}' already registered for {}.".format(
+                        name, cls.mapping["model_name_mapping"][name]
+                    )
+                )
             cls.mapping["model_name_mapping"][name] = model_cls
             return model_cls
         Usage:
+            from .registry import registry
         """
         def wrap(processor_cls):
         Usage:
+            from .registry import registry
         """
         def wrap(lr_sched_cls):
         Usage:
+            .common.registry import registry
         """
         def wrap(runner_cls):
         Usage:
+            from .registry import registry
         """
         assert isinstance(path, str), "All path must be str."
         if name in cls.mapping["paths"]:
         Usage::
+            from .registry import registry
             registry.register("config", {})
         """
             name: Key which needs to be removed.
         Usage::
+            from registry import registry
             config = registry.unregister("config")
         """

utils.py CHANGED Viewed

@@ -468,136 +468,3 @@ def merge_vision_embeddings(input_ids: torch.Tensor,
         inputs_embeds[mask] = torch.cat(vision_embeddings)
     return inputs_embeds
-class LayerFn(Protocol):
-    def __call__(
-        self,
-        prefix="",
-    ) -> torch.nn.Module:
-        ...
-class PPMissingLayer(torch.nn.Identity):
-    """
-    A placeholder layer for missing layers in a pipeline parallel model.
-    """
-    def __init__(self, *args, **kwargs):
-        super().__init__()
-_CPU_OFFLOAD_BYTES = 0
-_CPU_OFFLOAD_MAX_BYTES = 0
-def set_cpu_offload_max_bytes(max_bytes: int) -> None:
-    global _CPU_OFFLOAD_MAX_BYTES, _CPU_OFFLOAD_BYTES
-    _CPU_OFFLOAD_BYTES = 0
-    _CPU_OFFLOAD_MAX_BYTES = max_bytes
-def maybe_offload_to_cpu(module: torch.nn.Module) -> torch.nn.Module:
-    device = next(module.parameters()).device
-    if device == torch.device("cpu"):
-        return module
-    global _CPU_OFFLOAD_MAX_BYTES, _CPU_OFFLOAD_BYTES
-    if _CPU_OFFLOAD_BYTES >= _CPU_OFFLOAD_MAX_BYTES:
-        return module
-    pin_memory = is_pin_memory_available()
-    # offload parameters to CPU
-    # use pin_memory if possible, which helps cudagraph capture speed
-    for p in module.parameters():
-        if _CPU_OFFLOAD_BYTES >= _CPU_OFFLOAD_MAX_BYTES:
-            # we use per-parameter offloading
-            # one module might have some parameters offloaded and some not
-            break
-        # `torch.empty_like` does not support `pin_memory` argument
-        cpu_data = torch.empty(size=p.data.size(),
-                               dtype=p.data.dtype,
-                               layout=p.data.layout,
-                               device='cpu',
-                               pin_memory=pin_memory)
-        cpu_data.copy_(p.data)
-        p.data = cpu_data
-        _CPU_OFFLOAD_BYTES += p.data.numel() * p.data.element_size()
-    state_dict: Dict[str, torch.Tensor] = module.state_dict()
-    original_forward = module.forward
-    def forward(*args, **kwargs):
-        module.forward = original_forward
-        device_state = {
-            # here we blindly call `to(device)`
-            # if the parameter is already on the device, it will be a no-op
-            k: v.to(device, non_blocking=True)
-            for k, v in state_dict.items()
-        }
-        output = functional_call(module,
-                                 device_state,
-                                 args=args,
-                                 kwargs=kwargs)
-        module.forward = forward
-        return output
-    module.forward = forward
-    return module
-def make_layers(
-    num_hidden_layers: int,
-    layer_fn: LayerFn,
-    prefix: str,
-) -> Tuple[int, int, torch.nn.ModuleList]:
-    """Make a list of layers with the given layer function, taking
-    pipeline parallelism into account.
-    """
-    from vllm.distributed.parallel_state import get_pp_group
-    from vllm.distributed.utils import get_pp_indices
-    start_layer, end_layer = get_pp_indices(num_hidden_layers,
-                                            get_pp_group().rank_in_group,
-                                            get_pp_group().world_size)
-    modules = torch.nn.ModuleList(
-        [PPMissingLayer() for _ in range(start_layer)] + [
-            maybe_offload_to_cpu(layer_fn(prefix=f"{prefix}.{idx}"))
-            for idx in range(start_layer, end_layer)
-        ] + [PPMissingLayer() for _ in range(end_layer, num_hidden_layers)])
-    return start_layer, end_layer, modules
-# NOTE: don't use lru_cache here because it can prevent garbage collection
-_model_to_pp_missing_layer_names: Dict[int, List[str]] = {}
-def get_pp_missing_layer_names(model: torch.nn.Module) -> List[str]:
-    """Get the names of the missing layers in a pipeline parallel model."""
-    model_id = id(model)
-    if model_id in _model_to_pp_missing_layer_names:
-        return _model_to_pp_missing_layer_names[model_id]
-    missing_layer_names = []
-    for name, module in model.named_modules():
-        if isinstance(module, PPMissingLayer):
-            # NOTE: the trailing dot is used to match the prefix of the layer.
-            # without the dot, we could match a layer that is not missing,
-            # e.g., 'encoder.layer.1' would match 'encoder.layer.11'
-            missing_layer_names.append(name + '.')
-    _model_to_pp_missing_layer_names[model_id] = missing_layer_names
-    return missing_layer_names
-def is_pp_missing_parameter(name: str, model: torch.nn.Module) -> bool:
-    """Check if a parameter is missing in a pipeline parallel model."""
-    for missing_layer_name in get_pp_missing_layer_names(model):
-        if name.startswith(missing_layer_name):
-            return True
-    return False


468	inputs_embeds[mask] = torch.cat(vision_embeddings)
469
470	return inputs_embeds