Joshua Chak's picture

Joshua Chak

JoshuaChak

·

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

nari-labs/Dia-1.6B

liked a model 7 days ago

HiDream-ai/HiDream-I1-Full

liked a model 19 days ago

meta-llama/Llama-4-Scout-17B-16E-Instruct

View all activity

Organizations

JoshuaChak's activity

upvoted a paper about 1 month ago

LHM: Large Animatable Human Reconstruction Model from a Single Image in Seconds

Paper • 2503.10625 • Published Mar 13 • 32

upvoted a collection about 1 month ago

OLMo 2

Artifacts for the OLMo 2 release. • 27 items • Updated about 20 hours ago • 110

upvoted a paper 3 months ago

Scaling Embedding Layers in Language Models

Paper • 2502.01637 • Published Feb 3 • 24

upvoted a paper 4 months ago

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 149

upvoted 4 papers 6 months ago

Task Vectors are Cross-Modal

Paper • 2410.22330 • Published Oct 29, 2024 • 11

Movie Gen: A Cast of Media Foundation Models

Paper • 2410.13720 • Published Oct 17, 2024 • 98

HART: Efficient Visual Generation with Hybrid Autoregressive Transformer

Paper • 2410.10812 • Published Oct 14, 2024 • 18

MiniPLM: Knowledge Distillation for Pre-Training Language Models

Paper • 2410.17215 • Published Oct 22, 2024 • 16

upvoted 2 papers 7 months ago

Autonomous Character-Scene Interaction Synthesis from Text Instruction

Paper • 2410.03187 • Published Oct 4, 2024 • 7

Presto! Distilling Steps and Layers for Accelerating Music Generation

Paper • 2410.05167 • Published Oct 7, 2024 • 18

upvoted a paper 9 months ago

Learning to (Learn at Test Time): RNNs with Expressive Hidden States

Paper • 2407.04620 • Published Jul 5, 2024 • 32

upvoted 3 papers 10 months ago

Scaling Rectified Flow Transformers for High-Resolution Image Synthesis

Paper • 2403.03206 • Published Mar 5, 2024 • 66

Transformers meet Neural Algorithmic Reasoners

Paper • 2406.09308 • Published Jun 13, 2024 • 45

Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling

Paper • 2406.07522 • Published Jun 11, 2024 • 40

upvoted 3 papers 11 months ago

Chameleon: Mixed-Modal Early-Fusion Foundation Models

Paper • 2405.09818 • Published May 16, 2024 • 132

Many-Shot In-Context Learning in Multimodal Foundation Models

Paper • 2405.09798 • Published May 16, 2024 • 33

LoRA Learns Less and Forgets Less

Paper • 2405.09673 • Published May 15, 2024 • 89