Zikun Li's picture

122 10

Zikun Li

zikun-li

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 13 days ago

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

upvoted a paper 13 days ago

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

upvoted a paper 13 days ago

Video-R1: Reinforcing Video Reasoning in MLLMs

View all activity

Organizations

None yet

zikun-li's activity

upvoted 3 papers 13 days ago

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

Paper • 2503.21460 • Published 14 days ago • 73

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

Paper • 2503.21380 • Published 14 days ago • 36

Video-R1: Reinforcing Video Reasoning in MLLMs

Paper • 2503.21776 • Published 14 days ago • 76

upvoted 10 papers 14 days ago

Gemma 3 Technical Report

Paper • 2503.19786 • Published 16 days ago • 43

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published 21 days ago • 49

Reasoning to Learn from Latent Thoughts

Paper • 2503.18866 • Published 17 days ago • 13

Vision-R1: Evolving Human-Free Alignment in Large Vision-Language Models via Vision-Guided Reinforcement Learning

Paper • 2503.18013 • Published 18 days ago • 18

SimpleRL-Zoo: Investigating and Taming Zero Reinforcement Learning for Open Base Models in the Wild

Paper • 2503.18892 • Published 17 days ago • 28

Video-T1: Test-Time Scaling for Video Generation

Paper • 2503.18942 • Published 17 days ago • 86

Think Twice: Enhancing LLM Reasoning by Scaling Multi-round Test-time Thinking

Paper • 2503.19855 • Published 16 days ago • 25

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Paper • 2503.19325 • Published 17 days ago • 71

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

Paper • 2503.19757 • Published 16 days ago • 48

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 16 days ago • 132

upvoted 3 papers 20 days ago

DiffMoE: Dynamic Token Selection for Scalable Diffusion Transformers

Paper • 2503.14487 • Published 23 days ago • 27

Survey on Evaluation of LLM-based Agents

Paper • 2503.16416 • Published 21 days ago • 84

Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models

Paper • 2503.16419 • Published 21 days ago • 67

upvoted a paper 21 days ago

Small Models Struggle to Learn from Strong Reasoners

Paper • 2502.12143 • Published Feb 17 • 34

upvoted a paper 22 days ago

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published 23 days ago • 22

upvoted 2 papers 23 days ago

Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey

Paper • 2503.12605 • Published 25 days ago • 32

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

Paper • 2503.12937 • Published 24 days ago • 27