Xilin Jiang's picture

1 13 1

Xilin Jiang

xi-j

·

xi-j

AI & ML interests

None yet

Organizations

None yet

xi-j's activity

upvoted 3 papers about 1 month ago

UniMuMo: Unified Text, Music and Motion Generation

Paper • 2410.04534 • Published Oct 6 • 18

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 165

Presto! Distilling Steps and Layers for Accelerating Music Generation

Paper • 2410.05167 • Published Oct 7 • 15

upvoted 8 papers 3 months ago

Building and better understanding vision-language models: insights and future directions

Paper • 2408.12637 • Published Aug 22 • 118

Foundation Models for Music: A Survey

Paper • 2408.14340 • Published Aug 26 • 42

SwiftBrush v2: Make Your One-step Diffusion Model Better Than Its Teacher

Paper • 2408.14176 • Published Aug 26 • 60

The Mamba in the Llama: Distilling and Accelerating Hybrid Models

Paper • 2408.15237 • Published Aug 27 • 37

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 107

SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 108

Language Model Can Listen While Speaking

Paper • 2408.02622 • Published Aug 5 • 37

Speech-MASSIVE: A Multilingual Speech Dataset for SLU and Beyond

Paper • 2408.03900 • Published Aug 7 • 9

upvoted 2 papers 4 months ago

Qwen2-Audio Technical Report

Paper • 2407.10759 • Published Jul 15 • 55

Speech Slytherin: Examining the Performance and Efficiency of Mamba for Speech Separation, Recognition, and Synthesis

Paper • 2407.09732 • Published Jul 13 • 8