Malthe August Bordin Bresler's picture

10

Malthe August Bordin Bresler

maltheaugust

maltheaugust

AI & ML interests

None yet

Recent Activity

upvoted a paper about 6 hours ago

JudgeLRM: Large Reasoning Models as a Judge

upvoted a paper about 6 hours ago

ZClip: Adaptive Spike Mitigation for LLM Pre-Training

upvoted a paper 7 days ago

AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation

View all activity

Organizations

None yet

maltheaugust's activity

upvoted 2 papers about 6 hours ago

JudgeLRM: Large Reasoning Models as a Judge

Paper • 2504.00050 • Published 9 days ago • 54

ZClip: Adaptive Spike Mitigation for LLM Pre-Training

Paper • 2504.02507 • Published 5 days ago • 74

upvoted a paper 7 days ago

AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation

Paper • 2503.19693 • Published 14 days ago • 75

upvoted a paper 11 days ago

LogQuant: Log-Distributed 2-Bit Quantization of KV Cache with Superior Accuracy Preservation

Paper • 2503.19950 • Published 14 days ago • 10

upvoted 3 papers 18 days ago

RWKV-7 "Goose" with Expressive Dynamic State Evolution

Paper • 2503.14456 • Published 21 days ago • 136

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published 21 days ago • 115

φ-Decoding: Adaptive Foresight Sampling for Balanced Inference-Time Exploration and Exploitation

Paper • 2503.13288 • Published 22 days ago • 49

upvoted 2 papers 21 days ago

SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion

Paper • 2503.11576 • Published 25 days ago • 89

Transformers without Normalization

Paper • 2503.10622 • Published 26 days ago • 154

upvoted a paper 25 days ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 27 days ago • 68