euclid-multimodal
/

Euclid-convnext-xxlarge-120524

Question Answering

text-generation

Inference Endpoints

Model card Files Files and versions Community

jrzhang commited on 15 days ago

Commit

09c6657

•

1 Parent(s): 5dec1c8

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -10,6 +10,9 @@ metrics:
 - accuracy
 library_name: transformers
 ---
 # Model Card for Euclid-convnext-xxlarge (Version on 12/05/2024)
 A multimodal large language models specifically trained for strong low-level geometric perception.
@@ -26,8 +29,8 @@ It combines a ConvNeXt visual encoder with a Qwen-2.5 language model, connected
 ### Model Sources [optional]
 - **Repository:** https://github.com/euclid-multimodal/Euclid
-- **Paper:** [Paper Link]
-- **Demo:** [Demo Link if available]
 ## Uses

 - accuracy
 library_name: transformers
 ---
+Paper: [Euclid: Supercharging Multimodal LLMs with Synthetic High-Fidelity Visual Descriptions](https://arxiv.org/abs/2412.08737)
 # Model Card for Euclid-convnext-xxlarge (Version on 12/05/2024)
 A multimodal large language models specifically trained for strong low-level geometric perception.
 ### Model Sources [optional]
 - **Repository:** https://github.com/euclid-multimodal/Euclid
+- **Paper:** https://arxiv.org/abs/2412.08737
+- **Demo:** https://euclid-multimodal.github.io/
 ## Uses