Talha Rüzgar Akkuş's picture

Building on HF

Talha Rüzgar Akkuş

Q-bert

·

AI & ML interests

AI, NLP, Math Hypothesis,NP Problems,Competitive programming

Recent Activity

upvoted a paper 7 days ago

Diffutron: A Masked Diffusion Language Model for Turkish Language

authored a paper about 2 months ago

Selectivity and Shape in the Design of Forward-Forward Goodness Functions

submitted a paper 2 months ago

Diffutron: A Masked Diffusion Language Model for Turkish Language

View all activity

Organizations

upvoted a paper 7 days ago

Diffutron: A Masked Diffusion Language Model for Turkish Language

Paper • 2603.20466 • Published Mar 20 • 9

upvoted a paper 7 months ago

Superpositional Gradient Descent: Harnessing Quantum Principles for Model Training

Paper • 2511.01918 • Published Nov 1, 2025 • 13

upvoted a paper 11 months ago

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

Paper • 2507.08800 • Published Jul 11, 2025 • 81

upvoted a paper 12 months ago

Wait, We Don't Need to "Wait"! Removing Thinking Tokens Improves Reasoning Efficiency

Paper • 2506.08343 • Published Jun 10, 2025 • 54

upvoted 6 papers about 1 year ago

Reasoning Models Can Be Effective Without Thinking

Paper • 2504.09858 • Published Apr 14, 2025 • 12

Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models

Paper • 2504.13626 • Published Apr 18, 2025 • 7

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

Paper • 2504.08791 • Published Apr 7, 2025 • 140

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published Mar 30, 2025 • 141

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12, 2025 • 77

Forgetting Transformer: Softmax Attention with a Forget Gate

Paper • 2503.02130 • Published Mar 3, 2025 • 32

upvoted 2 papers over 1 year ago

Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published Feb 25, 2025 • 50

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4, 2025 • 260

upvoted an article over 1 year ago

Article

Welcome to Inference Providers on the Hub 🔥

+5

burkaygur, zeke, aton2006, hassanelmghari, sbrandeis, kramp, julien-c

•

Jan 28, 2025

• 494

upvoted a paper over 1 year ago

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published Jan 9, 2025 • 62

upvoted a collection over 1 year ago

Human-Like LLMs

Human-Like LLMs series. • 5 items • Updated Jan 20, 2025 • 17

upvoted a paper over 1 year ago

Were RNNs All We Needed?

Paper • 2410.01201 • Published Oct 2, 2024 • 53

upvoted a paper almost 2 years ago

Diffusion Models Are Real-Time Game Engines

Paper • 2408.14837 • Published Aug 27, 2024 • 126

upvoted 2 papers over 2 years ago

TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and Generation

Paper • 2401.14373 • Published Jan 25, 2024 • 12

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 150

upvoted a collection over 2 years ago

Mamba

Mamba SSM Models with hf_integration. • 7 items • Updated Dec 28, 2023 • 7