Model card for vit_base_patch16_224_waifumerge

A Vision Transformer (ViT) image feature model. Trained with Self-Supervised DINO method.

Model Stock merge of vit_base_patch16_224.dino, vit_base_patch16_224.augreg2_in21k_ft_in1k and wd-vit-tagger-v3 just to see what would happen ¯_(ツ)_/¯

Downloads last month: 19

Inference Providers NEW

Image Feature Extraction

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support