Brynn

pybbb

·

[email protected]

AI & ML interests

None yet

Organizations

upvoted 2 papers 8 months ago

Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning

Paper • 2511.16043 • Published Nov 20, 2025 • 110

Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

Paper • 2511.08577 • Published Nov 11, 2025 • 110

upvoted 2 papers 9 months ago

When "Correct" Is Not Safe: Can We Trust Functionally Correct Patches Generated by Code Agents?

Paper • 2510.17862 • Published Oct 15, 2025 • 7

Prosperity before Collapse: How Far Can Off-Policy RL Reach with Stale Data on LLMs?

Paper • 2510.01161 • Published Oct 1, 2025 • 14