Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

26,876

Full-text search

Active filters: 8-bit

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 3 days ago • 16.8k • 49

openai/gpt-oss-120b

Text Generation • 120B • Updated Aug 26, 2025 • 2.84M • • 4.42k

openai/gpt-oss-20b

Text Generation • 22B • Updated Aug 26, 2025 • 6.14M • • 4.28k

microsoft/bitnet-b1.58-2B-4T

Text Generation • 0.8B • Updated Dec 17, 2025 • 6.16k • 1.28k

GadflyII/GLM-4.7-Flash-NVFP4

Text Generation • 18B • Updated 12 days ago • 203k • 53

openai/gpt-oss-safeguard-20b

Text Generation • 22B • Updated 18 days ago • 20.7k • • 187

unsloth/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 4 days ago • 42 • 5

mlx-community/Qwen3-ASR-1.7B-8bit

0.8B • Updated 3 days ago • 152 • 5

lukealonso/MiniMax-M2.1-NVFP4

115B • Updated 27 days ago • 27.4k • 21

lmstudio-community/GLM-4.7-Flash-MLX-8bit

Text Generation • 30B • Updated 10 days ago • 514k • 7

mlx-community/Qwen3-TTS-12Hz-1.7B-CustomVoice-8bit

Text-to-Speech • 0.8B • Updated 6 days ago • 598 • 4

GadflyII/GLM-4.7-Flash-MXFP4

Text Generation • 18B • Updated 6 days ago • 1.1k • 5

nvidia/DeepSeek-R1-NVFP4

Text Generation • 397B • Updated Jun 6, 2025 • 9.97k • 270

FabioSarracino/VibeVoice-Large-Q8

Text-to-Audio • 9B • Updated Oct 1, 2025 • 2.6k • 81

nvidia/NVIDIA-Nemotron-Nano-12B-v2-VL-NVFP4-QAD

Image-Text-to-Text • 8B • Updated Nov 13, 2025 • 35.7k • 17

mlx-community/Jan-v3-4B-base-instruct-8bit

Text Generation • 1B • Updated 6 days ago • 57 • 3

nvidia/NVIDIA-Nemotron-Nano-9B-v2-NVFP4

Text Generation • 6B • Updated 24 days ago • 10.9k • 17

mlx-community/DeepSeek-OCR-8bit

Image-Text-to-Text • 1B • Updated 4 days ago • 1.45k • 31

ig1/Qwen3-VL-30B-A3B-Instruct-NVFP4

Image-Text-to-Text • 18B • Updated 21 days ago • 2.52k • 6

kldzj/gpt-oss-120b-heretic-v2

Text Generation • 117B • Updated Nov 18, 2025 • 319 • 18

numind/NuMarkdown-8B-Thinking-mlx-8bits

Image-to-Text • Updated Nov 24, 2025 • 38 • 3

Salyut1/GLM-4.7-NVFP4

Text Generation • 177B • Updated Dec 23, 2025 • 6.02k • 12

Tengyunw/GLM-4.7-NVFP4

Text Generation • 177B • Updated Dec 26, 2025 • 4.04k • 6

mlx-community/GLM-4.7-Flash-8bit

Text Generation • 30B • Updated 7 days ago • 11.7k • 17

mlx-community/Qwen3-TTS-12Hz-0.6B-CustomVoice-8bit

Text-to-Speech • 0.5B • Updated 7 days ago • 1.92k • 9

Chris-Kode/sweep-next-edit-1.5b-mlx

Text Generation • 0.4B • Updated 8 days ago • 93 • 2

MaziyarPanahi/rank_zephyr_7b_v1_full-GGUF

Text Ranking • 7B • Updated Apr 2, 2025 • 113 • 6

StefanKrsteski/Phi-3-mini-4k-instruct-GPTQ-8bit

Text Generation • 4B • Updated Jun 8, 2024 • 6 • 1

MaziyarPanahi/Meta-Llama-3.1-8B-Instruct-GGUF

Text Generation • 8B • Updated Jul 23, 2024 • 137k • 33

MaziyarPanahi/Phi-3.5-mini-instruct-GGUF

Text Generation • 4B • Updated Aug 20, 2024 • 163k • 25