xu's picture

1

xu

xuzhaopan

AI & ML interests

None yet

Recent Activity

authored a paper about 9 hours ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

authored a paper about 9 hours ago

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

updated a dataset 1 day ago

xuzhaopan/MPBench

View all activity

Organizations

None yet

xuzhaopan's activity

authored 2 papers about 9 hours ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

Paper • 2503.12545 • Published 3 days ago • 4

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

Paper • 2503.12505 • Published 3 days ago • 8

updated 2 datasets 1 day ago

xuzhaopan/MPBench

Updated 1 day ago • 10

xuzhaopan/PEBench

Viewer • Updated 1 day ago • 8.2k • 38

authored a paper 2 days ago

ProJudge: A Multi-Modal Multi-Discipline Benchmark and Instruction-Tuning Dataset for MLLM-based Process Judges

Paper • 2503.06553 • Published 10 days ago • 8

published a dataset 4 days ago

xuzhaopan/MPBench

Updated 1 day ago • 10

published a dataset 7 days ago

xuzhaopan/PEBench

Viewer • Updated 1 day ago • 8.2k • 38

authored a paper 4 months ago

GATE OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation

Paper • 2411.18499 • Published Nov 27, 2024 • 18