AImageLab

university

https://aimagelab.ing.unimore.it/

aimagelab

AI & ML interests

None defined yet.

Recent Activity

dcaffo new activity about 14 hours ago

aimagelab/ReT-CLIP-ViT-L-14:Remove library name

dcaffo new activity 2 days ago

aimagelab/ReT-CLIP-ViT-L-14:Add document retrieval tag

dcaffo updated a collection 6 days ago

View all activity

aimagelab's activity

dcaffo

in aimagelab/ReT-CLIP-ViT-L-14 about 14 hours ago

Remove library name

#2 opened 2 days ago by

dcaffo

in aimagelab/ReT-CLIP-ViT-L-14 2 days ago

Add document retrieval tag

#1 opened 2 days ago by

dcaffo

updated a collection 6 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

dcaffo

updated a dataset 8 days ago

aimagelab/ReT-M2KR

Preview • Updated 8 days ago • 43

dcaffo

updated 2 models 9 days ago

aimagelab/ReT-OpenCLIP-ViT-G-14

Updated 9 days ago • 9

aimagelab/ReT-OpenCLIP-ViT-H-14

Updated 9 days ago • 8

fede97

updated a collection 9 days ago

ReflectiVA

Models and data for ReflectiVA: Augmenting Multimodal LLMs with Self-Reflective Tokens for Knowledge-based Visual Question Answering [CVPR 2025] • 2 items • Updated 9 days ago

dcaffo

updated a collection 9 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

dcaffo

published a model 9 days ago

aimagelab/ReT-OpenCLIP-ViT-G-14

Updated 9 days ago • 9

dcaffo

updated a collection 9 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

dcaffo

published a model 9 days ago

aimagelab/ReT-OpenCLIP-ViT-H-14

Updated 9 days ago • 8

dcaffo

updated a model 9 days ago

aimagelab/ReT-CLIP-ViT-L-14

Visual Document Retrieval • Updated 2 days ago • 32

dcaffo

updated a collection 10 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

dcaffo

published a model 10 days ago

aimagelab/ReT-CLIP-ViT-L-14

Visual Document Retrieval • Updated 2 days ago • 32

dcaffo

updated a collection 10 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

dcaffo

published a dataset 10 days ago

aimagelab/ReT-M2KR

Preview • Updated 8 days ago • 43

dcaffo

updated a collection 10 days ago

ReT

Models and data for ReT: Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval [CVPR 2025] • 6 items • Updated 6 days ago

fede97

authored a paper 11 days ago

LLaVA-MORE: A Comparative Study of LLMs and Visual Backbones for Enhanced Visual Instruction Tuning

Paper • 2503.15621 • Published 15 days ago

ssarto

updated a model 11 days ago

aimagelab/LLaVA_MORE-llama_3_1-8B-finetuning

Image-Text-to-Text • Updated 11 days ago • 824 • 9