Nikolai Debono's picture

1 25 3

Nikolai Debono

boccu2009

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

upvoted a paper 6 days ago

DDT: Decoupled Diffusion Transformer

upvoted a paper 7 days ago

Scaling Laws of Synthetic Data for Language Models

View all activity

Organizations

None yet

boccu2009's activity

upvoted 2 papers 6 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

Paper • 2504.07096 • Published 7 days ago • 66

DDT: Decoupled Diffusion Transformer

Paper • 2504.05741 • Published 8 days ago • 69

upvoted a paper 7 days ago

Scaling Laws of Synthetic Data for Language Models

Paper • 2503.19551 • Published 22 days ago • 1

upvoted 6 papers 15 days ago

Efficient Model Development through Fine-tuning Transfer

Paper • 2503.20110 • Published 22 days ago • 4

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published 19 days ago • 43

Efficient Inference for Large Reasoning Models: A Survey

Paper • 2503.23077 • Published 18 days ago • 45

What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

Paper • 2503.24235 • Published 16 days ago • 52

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published 16 days ago • 61

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Paper • 2503.16252 • Published 27 days ago • 27

upvoted a paper 28 days ago

Personalize Anything for Free with Diffusion Transformer

Paper • 2503.12590 • Published about 1 month ago • 43

upvoted a collection about 2 months ago

Reasoning Datasets

Distilled synthetic Reasoning datasets • 7 items • Updated Feb 2 • 60

upvoted 2 papers 3 months ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 105

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17 • 114

upvoted 5 papers 4 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 365

Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers

Paper • 2412.12276 • Published Dec 16, 2024 • 15

Are Your LLMs Capable of Stable Reasoning?

Paper • 2412.13147 • Published Dec 17, 2024 • 95

Multimodal Latent Language Modeling with Next-Token Diffusion

Paper • 2412.08635 • Published Dec 11, 2024 • 45

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 116

upvoted a collection 4 months ago

LLM Reasoning Papers

Papers to improve reasoning capabilities of LLMs • 20 items • Updated Jan 15 • 122

upvoted a paper 4 months ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published Dec 9, 2024 • 82