Harold Chen's picture

4 8 6

Harold Chen

Harold328

·

https://haroldchen19.github.io/

HaroldChen19

AI & ML interests

Computer Vision

Recent Activity

authored a paper 4 days ago

VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models

upvoted a paper 4 days ago

Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

upvoted a paper 4 days ago

VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models

View all activity

Organizations

None yet

Harold328's activity

upvoted 2 papers 4 days ago

Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

Paper • 2504.12626 • Published 5 days ago • 44

VistaDPO: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models

Paper • 2504.13122 • Published 5 days ago • 21

upvoted 2 papers about 1 month ago

Temporal Regularization Makes Your Video Generator Stronger

Paper • 2503.15417 • Published Mar 19 • 22

LightGen: Efficient Image Generation through Knowledge Distillation and Direct Preference Optimization

Paper • 2503.08619 • Published Mar 11 • 20

upvoted a paper 4 months ago

SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization

Paper • 2501.01245 • Published Jan 2 • 5

upvoted 3 papers 5 months ago

VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation

Paper • 2412.02259 • Published Dec 3, 2024 • 60

Identity-Preserving Text-to-Video Generation by Frequency Decomposition

Paper • 2411.17440 • Published Nov 26, 2024 • 38

OmniCreator: Self-Supervised Unified Generation with Universal Editing

Paper • 2412.02114 • Published Dec 3, 2024 • 14