zhangzef

Starrrrrry

AI & ML interests

None yet

Recent Activity

authored a paper 8 days ago

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

upvoted a paper 8 days ago

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

liked a dataset 10 days ago

Zhiqiang007/MathV360K

View all activity

Organizations

None yet

Starrrrrry's activity

authored a paper 8 days ago

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

Paper • 2504.10368 • Published 8 days ago • 21

upvoted a paper 8 days ago

S1-Bench: A Simple Benchmark for Evaluating System 1 Thinking Capability of Large Reasoning Models

Paper • 2504.10368 • Published 8 days ago • 21

liked a dataset 10 days ago

Zhiqiang007/MathV360K

Viewer • Updated Jun 27, 2024 • 339k • 512 • 26

authored a paper 19 days ago

Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization

Paper • 2503.17928 • Published about 1 month ago • 2

upvoted a paper 19 days ago

Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization

Paper • 2503.17928 • Published about 1 month ago • 2

updated a dataset 26 days ago

Starrrrrry/RLAIF-V-Bias-Dataset

Viewer • Updated 26 days ago • 68.1k • 92 • 2

liked a dataset about 2 months ago

OpenGVLab/MMPR-v1.1

Preview • Updated 10 days ago • 288 • 45

upvoted an article 2 months ago

Article

Open-R1: a fully open reproduction of DeepSeek-R1

Jan 28

• 845

updated a dataset 3 months ago

Starrrrrry/arxiv_insect

Preview • Updated Feb 4 • 6

published a dataset 3 months ago

Starrrrrry/arxiv_insect

Preview • Updated Feb 4 • 6

liked 2 datasets 4 months ago

openbmb/RLAIF-V-Dataset

Viewer • Updated Mar 4 • 74.8k • 2.09k • 170

Starrrrrry/RLAIF-V-Bias-Dataset

Viewer • Updated 26 days ago • 68.1k • 92 • 2