DAMO-NLP-SG
/

VL3-SigLIP-NaViT

Image Feature Extraction

videollama3_vision_encoder

feature-extraction

multi-modal-large-language-model

Model card Files Files and versions Community

VL3-SigLIP-NaViT

2 contributors

History: 12 commits

Cyril666's picture

Update configuration_videollama3_encoder.py

1b21f28 verified 8 days ago