Haitao Mi's picture

1 28 3

Haitao Mi

haitaominlp

·

https://scholar.google.com.sg/citations?user=G3OMbFSm858C&hl=en

AI & ML interests

Large Language Models

Recent Activity

upvoted a paper 3 days ago

Group Distributionally Robust Optimization-Driven Reinforcement Learning for LLM Reasoning

upvoted a collection 4 days ago

upvoted a paper about 2 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

View all activity

Organizations

Papers 11

arxiv:2508.19652

arxiv:2505.10962

arxiv:2503.23829

arxiv:2501.18585

models 0

None public yet

datasets 0

None public yet