5 69 40

Zichen Ding

heroding77

https://heroding77.github.io/

heroding77

AI & ML interests

None yet

Recent Activity

upvoted a paper about 22 hours ago

WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation

upvoted a paper 6 days ago

ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions

upvoted a paper 7 days ago

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL

View all activity

Organizations

upvoted a paper about 22 hours ago

WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation

Paper • 2605.25874 • Published 2 days ago • 88

upvoted a paper 6 days ago

ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions

Paper • 2605.20087 • Published 8 days ago • 16

upvoted a paper 7 days ago

EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL

Paper • 2605.18703 • Published 9 days ago • 48

authored 2 papers 30 days ago

OpenMobile: Building Open Mobile Agents with Task and Trajectory Synthesis

Paper • 2604.15093 • Published Apr 16 • 30

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published Mar 26 • 133

upvoted a paper about 1 month ago

OpenMobile: Building Open Mobile Agents with Task and Trajectory Synthesis

Paper • 2604.15093 • Published Apr 16 • 30

upvoted a paper about 2 months ago

SKILL0: In-Context Agentic Reinforcement Learning for Skill Internalization

Paper • 2604.02268 • Published Apr 2 • 101

upvoted a paper 2 months ago

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Paper • 2603.25040 • Published Mar 26 • 133

liked a dataset 2 months ago

lizh1/OmniGUIRewardBench

Viewer • Updated Mar 19 • 9.5k • 28.8k • 2

authored 2 papers 4 months ago

TIDE: Trajectory-based Diagnostic Evaluation of Test-Time Improvement in LLM Agents

Paper • 2602.02196 • Published Feb 2 • 35

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Paper • 2602.05843 • Published Feb 5 • 61

upvoted 2 papers 4 months ago

OdysseyArena: Benchmarking Large Language Models For Long-Horizon, Active and Inductive Interactions

Paper • 2602.05843 • Published Feb 5 • 61

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Paper • 2602.01734 • Published Feb 2 • 32

liked a model 4 months ago

internlm/Intern-S1-Pro

Image-Text-to-Text • Updated Mar 30 • 258k • 279

upvoted a paper 4 months ago

TIDE: Trajectory-based Diagnostic Evaluation of Test-Time Improvement in LLM Agents

Paper • 2602.02196 • Published Feb 2 • 35

liked a Space 4 months ago

ODS Project

💻

Run multiple AI tasks in one interface

upvoted a paper 4 months ago

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

Paper • 2601.12346 • Published Jan 18 • 52

updated a collection 4 months ago

Paper

Collection

Check out our paper list ! • 13 items • Updated Feb 20 • 3

upvoted a collection 4 months ago