hustvl
/

mmMamba-hybrid

Image-Text-to-Text

feature-extraction

Model card Files Files and versions Community

HongyuanTao commited on 9 days ago

Commit

f3e2a30

·

verified ·

1 Parent(s): 68654a2

Update modeling_mmMamba.py

Files changed (1) hide show

modeling_mmMamba.py +5 -7

modeling_mmMamba.py CHANGED Viewed

@@ -24,22 +24,20 @@ import torch.nn.functional as F
 import torch.utils.checkpoint
 from einops import rearrange
 from torch import nn
-from torch.nn import BCEWithLogitsLoss, CrossEntropyLoss, MSELoss
 from transformers.activations import ACT2FN
 from transformers.modeling_outputs import (BaseModelOutputWithPast,
-                                           CausalLMOutputWithPast,
-                                           SequenceClassifierOutputWithPast)
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import (add_start_docstrings,
                                 add_start_docstrings_to_model_forward, logging,
                                 replace_return_docstrings)
-from fla.modules import FusedRMSNormSwishGate, RMSNorm, ShortConvolution
-import copy
 from mamba_ssm.ops.triton.ssd_combined import mamba_chunk_scan_combined
 from mamba_ssm.ops.triton.selective_state_update import selective_state_update
 from causal_conv1d import causal_conv1d_fn, causal_conv1d_update
-from transformers.cache_utils import Cache
-import time
 try:
     from transformers.generation.streamers import BaseStreamer

 import torch.utils.checkpoint
 from einops import rearrange
 from torch import nn
+from torch.nn import CrossEntropyLoss
 from transformers.activations import ACT2FN
 from transformers.modeling_outputs import (BaseModelOutputWithPast,
+                                           CausalLMOutputWithPast)
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import (add_start_docstrings,
                                 add_start_docstrings_to_model_forward, logging,
                                 replace_return_docstrings)
+from fused_norm_gate import FusedRMSNormSwishGate
 from mamba_ssm.ops.triton.ssd_combined import mamba_chunk_scan_combined
 from mamba_ssm.ops.triton.selective_state_update import selective_state_update
 from causal_conv1d import causal_conv1d_fn, causal_conv1d_update
 try:
     from transformers.generation.streamers import BaseStreamer