SAMBIT CHAKRABORTY's picture

61 9

SAMBIT CHAKRABORTY

sambitchakhf03

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

upvoted a paper 1 day ago

OTC: Optimal Tool Calls via Reinforcement Learning

upvoted a paper 1 day ago

TTRL: Test-Time Reinforcement Learning

View all activity

Organizations

sambitchakhf03's activity

upvoted 3 papers 1 day ago

VisuLogic: A Benchmark for Evaluating Visual Reasoning in Multi-modal Large Language Models

Paper • 2504.15279 • Published 4 days ago • 61

OTC: Optimal Tool Calls via Reinforcement Learning

Paper • 2504.14870 • Published 5 days ago • 31

TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published 3 days ago • 77

upvoted a paper 9 days ago

Iterative Self-Training for Code Generation via Reinforced Re-Ranking

Paper • 2504.09643 • Published 12 days ago • 34

upvoted 3 papers 13 days ago

VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning

Paper • 2504.06958 • Published 16 days ago • 10

Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models

Paper • 2504.07951 • Published 15 days ago • 27

DeepSeek-R1 Thoughtology: Let's <think> about LLM Reasoning

Paper • 2504.07128 • Published 24 days ago • 82

upvoted a paper 15 days ago

DDT: Decoupled Diffusion Transformer

Paper • 2504.05741 • Published 18 days ago • 73

upvoted 2 papers 19 days ago

FreSca: Unveiling the Scaling Space in Diffusion Models

Paper • 2504.02154 • Published 23 days ago • 18

VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step

Paper • 2504.01956 • Published 23 days ago • 40

upvoted 3 papers 20 days ago

GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation

Paper • 2504.02782 • Published 22 days ago • 56

Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

Paper • 2504.01990 • Published 25 days ago • 258

ZClip: Adaptive Spike Mitigation for LLM Pre-Training

Paper • 2504.02507 • Published 22 days ago • 76

upvoted a paper 21 days ago

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 149

liked a model 21 days ago

sambitchakhf03/chatbox-llm-merged

Text Generation • Updated Aug 15, 2023 • 42 • 1

upvoted 2 papers about 1 month ago

Transformers without Normalization

Paper • 2503.10622 • Published Mar 13 • 160

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published Mar 6 • 94

upvoted 3 papers about 2 months ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published Feb 20 • 175

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

Paper • 2502.18137 • Published Feb 25 • 57

Multilingual Machine Translation with Open Large Language Models at Practical Scale: An Empirical Study

Paper • 2502.02481 • Published Feb 4 • 13