Dongwon Jo's picture

Dongwon Jo

dongwonjo

·

https://dongwonjo.github.io

AI & ML interests

Efficient AI, Model Compression, Sparse Attention, Quantization, Pruning, Generative Model, Large Language Model, Diffusion

Recent Activity

upvoted a paper 26 days ago

CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection

authored a paper 26 days ago

CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection

upvoted a paper 4 months ago

Squeezing Large-Scale Diffusion Models for Mobile

View all activity

Organizations

dongwonjo 's datasets

None public yet