Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model 3 days ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

nm-research published a model 3 days ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

nm-research updated a model 3 days ago

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt3

View all activity

Collections 6

View 6 collections

models 381

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step56712

2B • Updated 3 days ago • 407

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt3

0.6B • Updated 3 days ago • 112

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt2

0.6B • Updated 4 days ago • 44

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-step21k

2B • Updated 5 days ago • 67

inference-optimization/Qwen3-8B-from-Qwen3-8B_regen-speculators.eagle3-qwen3arch-ckpt1

1B • Updated 5 days ago • 10

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1-20260609-0052

0.6B • Updated 6 days ago • 6

inference-optimization/Qwen3-8B-speculator.dflash.swa.non-qwen3-ep0p11

2B • Updated 6 days ago • 108

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt1

0.6B • Updated 7 days ago • 221

inference-optimization/Laguna-XS.2-speculator.dflash-Qwen235B-500k-ckpt0.5

0.6B • Updated 7 days ago • 14

inference-optimization/Qwen3-8B-speculator.dflash.swa.unified-ep0p28

2B • Updated 7 days ago • 1

View 381 models

datasets 24

inference-optimization/every-eval-ever-demo

Updated 4 days ago • 17

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated 5 days ago • 7.47k • 39

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated 11 days ago • 7.47k • 72

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated 11 days ago • 7.67k • 45

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated 12 days ago • 189

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated 12 days ago • 62

inference-optimization/Qwen3-32B-responses

Preview • Updated 13 days ago • 40

inference-optimization/ctest-Qwen3.6-27B-speculator-dataset

Viewer • Updated 18 days ago • 5.61k • 34

inference-optimization/Gemma4-Responses-Nemotron

Viewer • Updated 24 days ago • 762k • 64 • 1

inference-optimization/Longbench_Samples_Specdec

Viewer • Updated 26 days ago • 160 • 67

View 24 datasets