Junkang Wu's picture

1 3

Junkang Wu

junkang0909

·

https://junkangwu.github.io/

AI & ML interests

LLM alignment

Recent Activity

upvoted a paper 2 days ago

Aligning Multimodal LLM with Human Preference: A Survey

upvoted a paper 9 days ago

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

authored a paper 11 days ago

RePO: ReLU-based Preference Optimization

View all activity

Organizations

None yet

junkang0909's activity

upvoted a paper 2 days ago

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published 4 days ago • 20

upvoted a paper 9 days ago

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

Paper • 2503.07572 • Published 12 days ago • 38

authored a paper 11 days ago

RePO: ReLU-based Preference Optimization

Paper • 2503.07426 • Published 12 days ago • 1

commented a paper 11 days ago

RePO: ReLU-based Preference Optimization

Paper • 2503.07426 • Published 12 days ago • 1 •

authored 4 papers 11 days ago

Direct Multi-Turn Preference Optimization for Language Agents

Paper • 2406.14868 • Published Jun 21, 2024

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published Feb 14 • 32

$β$-DPO: Direct Preference Optimization with Dynamic $β$

Paper • 2407.08639 • Published Jul 11, 2024

Towards Robust Alignment of Language Models: Distributionally Robustifying Direct Preference Optimization

Paper • 2407.07880 • Published Jul 10, 2024

upvoted a paper 11 days ago

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published Feb 14 • 32