Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

MeganEFlynn updated a model about 4 hours ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

MeganEFlynn published a model about 4 hours ago

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

kylesayrs updated a model about 7 hours ago

inference-optimization/Qwen3-1.6B-A0.9B

View all activity

inference-optimization 's models 355

inference-optimization/Gemma4-DFlash-SWA-Causal-Nemo-Cascade

4B • Updated about 4 hours ago

inference-optimization/Qwen3-1.6B-A0.9B

Text Generation • 2B • Updated about 7 hours ago

inference-optimization/gemma-4-1B-0.8B-tiny

1B • Updated about 8 hours ago

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

Text Generation • Updated 4 days ago • 171

inference-optimization/ctest-Qwen3.5-9B-subset-397-speculator.dflash

2B • Updated 4 days ago • 63

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w4a16

Text Generation • 32B • Updated 5 days ago • 175

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w8a8

Text Generation • 235B • Updated 5 days ago • 169

inference-optimization/Qwen3-235B-A22B-Instruct-2507-quantized.w4a16

Text Generation • 32B • Updated 5 days ago • 153

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 5 days ago • 128

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 5 days ago • 124

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-heuristic

Image-Text-to-Text • 32B • Updated 5 days ago • 155

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-noise

Image-Text-to-Text • 30B • Updated 5 days ago • 129

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-hybrid

Image-Text-to-Text • 30B • Updated 5 days ago • 114

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-heuristic

Image-Text-to-Text • 30B • Updated 5 days ago • 106

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-noise

Image-Text-to-Text • 28B • Updated 5 days ago • 111

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-hybrid

Image-Text-to-Text • 28B • Updated 5 days ago • 287

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-heuristic

Image-Text-to-Text • 28B • Updated 5 days ago • 117

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-noise

Image-Text-to-Text • 26B • Updated 5 days ago • 119

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-hybrid

Image-Text-to-Text • 26B • Updated 5 days ago • 124

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-heuristic

Image-Text-to-Text • 26B • Updated 5 days ago • 114

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-noise

Image-Text-to-Text • 24B • Updated 5 days ago • 108

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-hybrid

Image-Text-to-Text • 24B • Updated 5 days ago • 145

inference-optimization/Qwen3.6-35B-A3B-5.0-bits-mode-heuristic

Image-Text-to-Text • 24B • Updated 5 days ago • 449

inference-optimization/Gemma4_SWA_DFLASH

4B • Updated 5 days ago • 123

inference-optimization/DSV4-tiny-empty

3B • Updated 7 days ago • 490

inference-optimization/final-ctest-Qwen3-8B-speculator.dflash

2B • Updated 11 days ago • 87

inference-optimization/updated-ctest-Qwen3-8B-speculator.dflash

2B • Updated 17 days ago • 89

inference-optimization/qwen3_8b_7.0_bits_mode_noise_stiched

7B • Updated 17 days ago • 58

inference-optimization/qwen3_8b_7.0_bits_mode_hybrid_stiched

7B • Updated 17 days ago • 58

inference-optimization/qwen3_8b_7.0_bits_mode_heuristic_stiched

7B • Updated 17 days ago • 57