Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

MeganEFlynn updated a dataset about 12 hours ago

inference-optimization/Gemma4-Responses-Nemotron

MeganEFlynn published a dataset about 12 hours ago

inference-optimization/Gemma4-Responses-Nemotron

ChibuUkachi updated a model 1 day ago

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

View all activity

Collections 5

View 5 collections

models 352

inference-optimization/Ministral-3-14B-Instruct-2512-NVFP4

Text Generation • Updated 1 day ago • 163

inference-optimization/ctest-Qwen3.5-9B-subset-397-speculator.dflash

2B • Updated 2 days ago • 63

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w4a16

Text Generation • 32B • Updated 2 days ago • 162

inference-optimization/Qwen3-235B-A22B-Thinking-2507-quantized.w8a8

Text Generation • 235B • Updated 2 days ago • 155

inference-optimization/Qwen3-235B-A22B-Instruct-2507-quantized.w4a16

Text Generation • 32B • Updated 2 days ago • 140

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 3 days ago • 128

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 3 days ago • 124

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-heuristic

Image-Text-to-Text • 32B • Updated 3 days ago • 154

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-noise

Image-Text-to-Text • 30B • Updated 3 days ago • 129

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-hybrid

Image-Text-to-Text • 30B • Updated 3 days ago • 114

View 352 models

datasets 18

inference-optimization/Gemma4-Responses-Nemotron

Viewer • Updated about 12 hours ago • 762k • 5 • 1

inference-optimization/Longbench_Samples_Specdec

Viewer • Updated 3 days ago • 160 • 35

inference-optimization/ctest-subset-Qwen3.5-397B-A17B-FP8-dynamic-speculator-dataset

Viewer • Updated 3 days ago • 10k • 36

inference-optimization/final-ctest-Qwen3-8B-speculator-dataset

Viewer • Updated 9 days ago • 10k • 39

inference-optimization/updated-ctest-Qwen3-8B-speculator-dataset

Viewer • Updated 14 days ago • 10k • 50

inference-optimization/laguna-xs-ultrachat-responses

Viewer • Updated 23 days ago • 208k • 384

inference-optimization/laguna-xs-ultrachat-conversations

Viewer • Updated 29 days ago • 205k • 159

inference-optimization/laguna-xs-magpie-300k-responses

Viewer • Updated 29 days ago • 300k • 95

inference-optimization/laguna-xs-magpie-300k-conversations

Viewer • Updated 29 days ago • 298k • 102

inference-optimization/Qwen3-8b-sharegpt-5k

Preview • Updated Apr 18 • 3.39k

View 18 datasets