1 8

xuhuang

xuhuang87

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

upvoted a paper 29 days ago

CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era

upvoted a paper about 1 month ago

Process-based Self-Rewarding Language Models

View all activity

Organizations

None yet

xuhuang87's activity

upvoted a paper 1 day ago

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

Paper • 2504.08672 • Published 6 days ago • 42

upvoted a paper 29 days ago

CapArena: Benchmarking and Analyzing Detailed Image Captioning in the LLM Era

Paper • 2503.12329 • Published Mar 16 • 24

upvoted a paper about 1 month ago

Process-based Self-Rewarding Language Models

Paper • 2503.03746 • Published Mar 5 • 39

upvoted a collection about 2 months ago

BenchMAX

Collection

10 items • Updated Feb 11 • 6

upvoted a paper 2 months ago

BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models

Paper • 2502.07346 • Published Feb 11 • 53

commented a paper 2 months ago

BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models

Paper • 2502.07346 • Published Feb 11 • 53 •

authored 3 papers 2 months ago

Lost in the Source Language: How Large Language Models Evaluate the Quality of Machine Translation

Paper • 2401.06568 • Published Jan 12, 2024

BenchMAX: A Comprehensive Multilingual Evaluation Suite for Large Language Models

Paper • 2502.07346 • Published Feb 11 • 53

IMTLab: An Open-Source Platform for Building, Evaluating, and Diagnosing Interactive Machine Translation Systems

Paper • 2310.11163 • Published Oct 17, 2023

upvoted a paper 4 months ago

OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis

Paper • 2412.19723 • Published Dec 27, 2024 • 89

upvoted a paper 5 months ago

OS-ATLAS: A Foundation Action Model for Generalist GUI Agents

Paper • 2410.23218 • Published Oct 30, 2024 • 51

upvoted a paper 7 months ago

A Controlled Study on Long Context Extension and Generalization in LLMs

Paper • 2409.12181 • Published Sep 18, 2024 • 45