Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

806

Base only

Active filters: modelopt

nvidia/NVIDIA-Nemotron-Labs-3-Puzzle-75B-A9B-NVFP4

Text Generation • 45B • Updated 7 days ago • 41.8k • 116

nvidia/Qwen3.6-27B-NVFP4

Text Generation • 18B • Updated 14 days ago • 1.15M • 354

madeby561/GLM-5.2-MXFP8-NVFP4-NF3-Hybrid

347B • Updated 5 days ago • 3.09k • 52

Jiunsong/SuperGLM-5.2-abliterated-NVFP4

Text Generation • 381B • Updated about 1 hour ago • 302 • 21

nvidia/GLM-5.2-NVFP4

Text Generation • 381B • Updated 18 days ago • 1.06M • 265

nvidia/Qwen3.6-35B-A3B-NVFP4

Text Generation • 19B • Updated Jun 12 • 8.58M • 463

nvidia/NVIDIA-Nemotron-Labs-3-Puzzle-75B-A9B-FP8

Text Generation • 78B • Updated 7 days ago • 22.9k • 17

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 10 days ago • 2.05M • 104

nvidia/Mistral-Medium-3.5-128B-NVFP4

Text Generation • 84B • Updated 13 days ago • 19.5k • 27

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated Jun 2 • 109k • 41

nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4

Text Generation • 335B • Updated 20 days ago • 341k • • 249

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated 18 days ago • 313k • 61

nvidia/Gemma-4-31B-IT-NVFP4

Text Generation • 21B • Updated about 17 hours ago • 2.4M • • 534

nvidia/Kimi-K2.7-Code-NVFP4

Text Generation • Updated 8 days ago • 62.9k • 5

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-NVFP4

Any-to-Any • 18B • Updated May 5 • 2.13M • 155

mitomtuna/MiMo-V2.5-0703-NVFP4-TP3

200B • Updated about 24 hours ago • 66 • 4

N8Programs/Qwen3.6-35B-A3B-AntiLoop-NVFP4

Text Generation • 19B • Updated 5 days ago • 647 • 4

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP

Text Generation • 20B • Updated 11 days ago • 53.9k • 35

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 1.74M • 115

r0b0tlab/Hy3-295B-NVFP4

Text Generation • 170B • Updated 6 days ago • 247 • 3

brandonmusic/GLM-5.2-NVFP4-TR3-Hybrid

Text Generation • Updated about 22 hours ago • 537 • 3

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4

Text Generation • 67B • Updated May 1 • 1.79M • 385

nvidia/MiniMax-M2.7-NVFP4

Text Generation • 116B • Updated Apr 24 • 79.9k • 64

AEON-7/Qwen3.6-27B-AEON-Ultimate-Uncensored-Multimodal-NVFP4-MTP-XS

Text Generation • 17B • Updated 12 days ago • 34.9k • 55

llmfan46/Qwen3.6-27B-uncensored-heretic-v2-Native-MTP-Preserved-NVFP4-GGUF

Image-Text-to-Text • 27B • Updated May 7 • 14k • 35

nvidia/GLM-5.1-NVFP4

Text Generation • 382B • Updated May 27 • 54.1k • 41

OpenYourMind/GLM-5.2-abliterated

432B • Updated 15 days ago • 2 • 26

morosystems/ThinkingCap-Qwen3.6-27B-NVFP4

Image-Text-to-Text • 15B • Updated 6 days ago • 3.55k • 2

mitomtuna/MiMo-V2.5-0703-NVFP4

179B • Updated about 24 hours ago • 896 • 2

mlx-community/Qwen3.6-35B-A3B-AntiLoop-NVFP4

Text Generation • 7B • Updated 4 days ago • 976 • 2