Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

684

Base only

Active filters: modelopt

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated 12 days ago • 4.48M • 311

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 1.98M • 96

lukealonso/GLM-5.2-NVFP4

Text Generation • 432B • Updated 8 days ago • 47.1k • 26

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated about 11 hours ago • 376k • • 211

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated 3 days ago • 3.21k • 12

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 2 days ago • 898 • 12

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 14 days ago • 830k • 84

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated about 8 hours ago • 12 • 9

madeby561/GLM-5.2-NVFP4-REAP-504B

Text Generation • 290B • Updated 4 days ago • 234 • 8

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 1.43M • 362

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP-XS

Text Generation • 17B • Updated about 18 hours ago • 43.2k • 51

lukealonso/MiniMax-M3-NVFP4

246B • Updated 11 days ago • 13.1k • 22

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 2 days ago • 302 • 5

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 1.74M • 145

sakamakismile/Huihui-Qwen3.6-27B-abliterated-NVFP4-MTP

Text Generation • 17B • Updated 25 days ago • 67.1k • 63

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-FP8

Any-to-Any • 33B • Updated May 5 • 73k • 57

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP

Text Generation • 20B • Updated about 18 hours ago • 37k • 21

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 27B • Updated May 7 • 19.5k • 29

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated 22 days ago • 35.6k • 21

stepfun-ai/Step-3.7-Flash-NVFP4

Image-Text-to-Text • 104B • Updated 24 days ago • 302k • 54

mmangkad/GLM-5.2-NVFP4

Text Generation • 381B • Updated 1 day ago • 1.5k • 3

brandonmusic/GLM-5.2-NVFP4-REAP-Recall-N172

Text Generation • 296B • Updated about 12 hours ago • 383 • 3

nvidia/Qwen3-30B-A3B-NVFP4

Text Generation • 16B • Updated Sep 10, 2025 • 84.6k • 36

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-FP8

Text Generation • 124B • Updated Apr 29 • 418k • 262

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 316k • 60

sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP

Text Generation • 17B • Updated Apr 29 • 440k • 76

nvidia/Kimi-K2.6-NVFP4

Text Generation • Updated May 15 • 732k • 38

Reza2kn/Cosmos3-Nano-NVFP4-AWQ

Text-to-Image • Updated 23 days ago • 75 • 2

Hcompany/Holo-3.1-35B-A3B-NVFP4

Image-Text-to-Text • 19B • Updated 22 days ago • 35.4k • 35

AxionML/Gemma-4-12B-NVFP4

Image-Text-to-Text • 8B • Updated 21 days ago • 45.9k • 5