Mantis - a TIGER-Lab Collection

TIGER-Lab 's Collections

Copilot

VISTA

VLM2Vec

MAmmoTH

UniIR

Science

Mantis

Mantis

updated Jul 2, 2024

Mantis model family optimized for multi-image reasoning with interleaved text/image format

TIGER-Lab/Mantis-8B-Idefics2

Image-Text-to-Text • Updated Nov 15, 2024 • 581 • 13

Note Current SoTA Mantis variant
TIGER-Lab/Mantis-8B-clip-llama3

Image-Text-to-Text • Updated Nov 15, 2024 • 264 • 1
TIGER-Lab/Mantis-8B-siglip-llama3

Image-Text-to-Text • Updated Nov 15, 2024 • 15.7k • 32

Note Current SoTA Mantis variant without multi-image pre-training
TIGER-Lab/Mantis-Instruct

Viewer • Updated Dec 25, 2024 • 999k • 2.57k • 32

Note Our training dataset
TIGER-Lab/Mantis-Eval

Viewer • Updated Nov 15, 2024 • 217 • 420 • 6

Note Curated evaluation benchmark for multi-image scenarios
MANTIS: Interleaved Multi-Image Instruction Tuning

Paper • 2405.01483 • Published May 2, 2024 • 6
Running on Zero

25

👁

Mantis

Multimodal Language Model
TIGER-Lab/Mantis-llava-7b

Image-Text-to-Text • Updated May 18, 2024 • 13 • 15
TIGER-Lab/Mantis-bakllava-7b

Image-Text-to-Text • Updated May 18, 2024 • 29 • 5
TIGER-Lab/Mantis-8B-Fuyu

Text Generation • Updated May 4, 2024 • 73 • 4
TIGER-Lab/OBELICS-100K

Viewer • Updated May 16, 2024 • 212k • 46 • 2