Models

221

Full-text search

Active filters: vLLM

mistralai/Mistral-Medium-3.5-128B

128B • Updated 21 days ago • 256k • 337

mistralai/Mistral-Small-4-119B-2603

119B • Updated 28 days ago • 62.8k • 379

unsloth/Mistral-Small-4-119B-2603-GGUF

119B • Updated Apr 20 • 13.7k • 69

QuantTrio/Qwen3.6-35B-A3B-AWQ

Image-Text-to-Text • 36B • Updated Apr 17 • 845k • 24

mistralai/Mistral-Small-4-119B-2603-eagle

Updated 28 days ago • 184 • 52

mradermacher/Mistral-Small-4-119B-2603-i1-GGUF

119B • Updated 30 days ago • 2.03k • 1

QuantTrio/Qwen3.6-27B-AWQ

Image-Text-to-Text • 28B • Updated Apr 23 • 886k • 11

QuantTrio/Qwen3.6-27B-AWQ-6Bit

Image-Text-to-Text • 28B • Updated Apr 23 • 31.5k • 9

RecViking/Mistral-Medium-3.5-128B-NVFP4

74B • Updated 16 days ago • 10.7k • 5

cyankiwi/Mistral-Medium-3.5-128B-AWQ-INT4

25B • Updated 20 days ago • 17.2k • 2

QuantTrio/Qwen3-Coder-30B-A3B-Instruct-AWQ

Text Generation • 31B • Updated Sep 5, 2025 • 516k • 8

QuantTrio/Qwen3.5-9B-AWQ

Image-Text-to-Text • 10B • Updated Mar 4 • 241k • 17

model-scope/glm-4-9b-chat-GPTQ-Int4

Text Generation • 9B • Updated Jul 17, 2024 • 28 • 6

model-scope/glm-4-9b-chat-GPTQ-Int8

Text Generation • 9B • Updated Jul 23, 2024 • 9 • 2

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • 73B • Updated May 12, 2025 • 57 • 2

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • 69B • Updated May 12, 2025 • 59

prithivMLmods/Nu2-Lupi-Qwen-14B

Text Generation • 15B • Updated Mar 27, 2025 • 6 • 2

mradermacher/Nu2-Lupi-Qwen-14B-GGUF

15B • Updated Jul 11, 2025 • 191 • 1

mradermacher/Nu2-Lupi-Qwen-14B-i1-GGUF

15B • Updated Jul 11, 2025 • 460 • 1

JunHowie/Qwen3-0.6B-GPTQ-Int4

Text Generation • 0.6B • Updated Sep 3, 2025 • 224 • 1

JunHowie/Qwen3-0.6B-GPTQ-Int8

Text Generation • 0.6B • Updated Sep 3, 2025 • 21

JunHowie/Qwen3-1.7B-GPTQ-Int4

Text Generation • 2B • Updated Sep 3, 2025 • 2.7k • 1

JunHowie/Qwen3-1.7B-GPTQ-Int8

Text Generation • 2B • Updated Sep 3, 2025 • 25

JunHowie/Qwen3-32B-GPTQ-Int4

Text Generation • 33B • Updated Sep 5, 2025 • 26.8k • 4

JunHowie/Qwen3-32B-GPTQ-Int8

Text Generation • 33B • Updated Sep 5, 2025 • 442 • 4

JunHowie/Qwen3-30B-A3B-GPTQ-Int4

Text Generation • 5B • Updated Sep 6, 2025 • 23 • 1

JunHowie/Qwen3-14B-GPTQ-Int8

Text Generation • 15B • Updated Sep 5, 2025 • 90 • 1

JunHowie/Qwen3-14B-GPTQ-Int4

Text Generation • 15B • Updated Sep 5, 2025 • 121k • 4

JunHowie/Qwen3-8B-GPTQ-Int8

Text Generation • 8B • Updated Sep 4, 2025 • 811

JunHowie/Qwen3-8B-GPTQ-Int4

Text Generation • 8B • Updated Sep 4, 2025 • 559 • 4