Santhana Mikhail Antony S

SMAntony

AI & ML interests

Large Language Models, Deep Learning, Computer Vision, Image Processing

Recent Activity

liked a Space about 2 months ago

nanotron/ultrascale-playbook

liked a model 2 months ago

Qwen/Qwen2.5-Coder-32B-Instruct

liked a model 2 months ago

vidore/colqwen2-v0.1

View all activity

Organizations

None yet

SMAntony's activity

liked a Space about 2 months ago

2.43k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

liked 3 models 2 months ago

upvoted a paper 2 months ago

Chain-of-Retrieval Augmented Generation

Paper • 2501.14342 • Published Jan 24 • 56

liked 3 models 2 months ago

unsloth/DeepSeek-R1-GGUF

Text Generation • Updated Feb 13 • 2.14M • 1.02k

answerdotai/ModernBERT-base

Fill-Mask • Updated Jan 15 • 3.29M • 819

deepseek-ai/Janus-Pro-7B

Any-to-Any • Updated Feb 1 • 272k • 3.3k

liked 3 models 3 months ago

AI4DS/NL2SQL_DeepSeek_33B

Text Generation • Updated May 6, 2024 • 111 • 1

defog/llama-3-sqlcoder-8b

Text Generation • Updated Jul 24, 2024 • 10.8k • 227

facebook/nllb-200-3.3B

Translation • Updated Feb 11, 2023 • 177k • 310

liked 3 models 4 months ago

nvidia/NV-Embed-v2

Feature Extraction • Updated Feb 23 • 84.1k • 412

facebook/detr-resnet-50

Object Detection • Updated Apr 10, 2024 • 925k • • 850

ai4bharat/indic-parler-tts

Text-to-Speech • Updated Dec 9, 2024 • 37k • 118

liked a Space 4 months ago

171

Indic Parler-TTS

👀

A demo of Indic Parler-TTS

liked 2 models 4 months ago

utter-project/EuroLLM-9B-Instruct

Text Generation • Updated Dec 9, 2024 • 13.5k • 163

TahaDouaji/detr-doc-table-detection

Object Detection • Updated Dec 6, 2024 • 352k • • 58

liked a model 5 months ago

Xkev/Llama-3.2V-11B-cot

Image-Text-to-Text • Updated Dec 16, 2024 • 4.57k • 149

upvoted a paper 5 months ago

LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning

Paper • 2410.02884 • Published Oct 3, 2024 • 55