4 44 64

Kyle Tuft

Chilangosta

AI & ML interests

None yet

Recent Activity

liked a model 2 days ago

google/siglip-so400m-patch14-384

liked a model 2 days ago

trashpanda-org/QwQ-32B-Snowdrop-v0

liked a model 3 days ago

Lightricks/LTX-Video

View all activity

Organizations

None yet

Chilangosta's activity

upvoted a paper 3 days ago

EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

Paper • 2503.07027 • Published 4 days ago • 23

upvoted a paper 4 days ago

VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control

Paper • 2503.05639 • Published 7 days ago • 21

upvoted 2 papers 6 days ago

EgoLife: Towards Egocentric Life Assistant

Paper • 2503.03803 • Published 9 days ago • 35

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published 8 days ago • 78

upvoted an article 8 days ago

Article

Remote VAEs for decoding with HF endpoints 🤗

18 days ago

• 36

upvoted a paper 10 days ago

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published 11 days ago • 72

upvoted a paper 17 days ago

VideoGrain: Modulating Space-Time Attention for Multi-grained Video Editing

Paper • 2502.17258 • Published 18 days ago • 73

upvoted a paper 23 days ago

Diffusion-Sharpening: Fine-tuning Diffusion Models with Denoising Trajectory Sharpening

Paper • 2502.12146 • Published 25 days ago • 16

upvoted a paper 24 days ago

Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation

Paper • 2502.08690 • Published 30 days ago • 41

upvoted a paper 25 days ago

MM-RLHF: The Next Step Forward in Multimodal LLM Alignment

Paper • 2502.10391 • Published 28 days ago • 32

upvoted a paper 28 days ago

CineMaster: A 3D-Aware and Controllable Framework for Cinematic Text-to-Video Generation

Paper • 2502.08639 • Published 30 days ago • 37

upvoted 9 papers about 1 month ago

Scaling Pre-training to One Hundred Billion Data for Vision Language Models

Paper • 2502.07617 • Published about 1 month ago • 29

Dual Caption Preference Optimization for Diffusion Models

Paper • 2502.06023 • Published Feb 9 • 9

FlashVideo:Flowing Fidelity to Detail for Efficient High-Resolution Video Generation

Paper • 2502.05179 • Published Feb 7 • 24

AuraFusion360: Augmented Unseen Region Alignment for Reference-based 360° Unbounded Scene Inpainting

Paper • 2502.05176 • Published Feb 7 • 32

HiFi-SR: A Unified Generative Transformer-Convolutional Adversarial Network for High-Fidelity Speech Super-Resolution

Paper • 2501.10045 • Published Jan 17 • 9

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

Paper • 2501.12380 • Published Jan 21 • 84