changtimwu (Tim Wu)

upvoted a paper 10 months ago

DistServe: Disaggregating Prefill and Decoding for Goodput-optimized Large Language Model Serving

Paper • 2401.09670 • Published Jan 18, 2024 • 2

upvoted an article 11 months ago

Article

Uncensor any LLM with abliteration

Jun 13, 2024

•

771

upvoted a paper 12 months ago

LLaVA-o1: Let Vision Language Models Reason Step-by-Step

Paper • 2411.10440 • Published Nov 15, 2024 • 129

upvoted 2 papers about 1 year ago

Search-o1: Agentic Search-Enhanced Large Reasoning Models

Paper • 2501.05366 • Published Jan 9, 2025 • 102

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28, 2025 • 124

upvoted an article almost 2 years ago

Article

Fine-tune Llama 3 with ORPO

Apr 22, 2024

•

241

upvoted 2 papers almost 2 years ago

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22, 2024 • 259

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 189

upvoted 2 papers about 2 years ago

Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians

Paper • 2312.03029 • Published Dec 5, 2023 • 26

Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling

Paper • 2311.00430 • Published Nov 1, 2023 • 56

Tim Wu

AI & ML interests

Organizations

DistServe: Disaggregating Prefill and Decoding for Goodput-optimized Large Language Model Serving

Uncensor any LLM with abliteration

LLaVA-o1: Let Vision Language Models Reason Step-by-Step

Search-o1: Agentic Search-Enhanced Large Reasoning Models

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Fine-tune Llama 3 with ORPO

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

DocLLM: A layout-aware generative language model for multimodal document understanding

Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic Gaussians

Distil-Whisper: Robust Knowledge Distillation via Large-Scale Pseudo Labelling

Tim Wu

AI & ML interests

Organizations

changtimwu's activity

Uncensor any LLM with abliteration

Fine-tune Llama 3 with ORPO