Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 2 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-avg121314

nm-research published a model about 2 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-avg121314

nm-research updated a model about 8 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt14

View all activity

Collections 3

View 3 collections

models 281

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-avg121314

2B • Updated about 2 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt14

2B • Updated about 8 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt13

2B • Updated about 12 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt12

2B • Updated about 15 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt11

2B • Updated about 19 hours ago

inference-optimization/Kimi-K3-0.40B-MXFP4

0.4B • Updated about 22 hours ago • 1 • 2

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt10

2B • Updated about 23 hours ago • 1

inference-optimization/Kimi-K3-0.40B-NVFP4

0.4B • Updated about 24 hours ago • 2 • 1

inference-optimization/Kimi-K3-0.40B

Feature Extraction • 0.4B • Updated about 24 hours ago • 24 • 25

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw.2048anc-qwen235b-instr-bs16-v3-10ep-ckpt9

2B • Updated 1 day ago • 16

View 281 models

datasets 28

inference-optimization/qwen3-test-model

Updated 8 days ago • 20

inference-optimization/dflash-qwen3-8b-qwen235b-instruct-bs16-prepared-data

Preview • Updated 20 days ago • 135

inference-optimization/every-eval-ever-demo

Viewer • Updated Jun 16 • 1 • 25

inference-optimization/DeepSeek-V4-Flash-responses

Viewer • Updated Jun 16 • 508k • 78

inference-optimization/Qwen3.5-4B-responses

Viewer • Updated Jun 10 • 7.47k • 51

inference-optimization/Qwen3.5-0.8B-responses

Viewer • Updated Jun 4 • 7.47k • 160

inference-optimization/Qwen3.5-9B-responses

Viewer • Updated Jun 4 • 7.67k • 80

inference-optimization/Qwen3-8B-Regenerated-Collection

Preview • Updated Jun 2 • 183

inference-optimization/Qwen3-30B-A3B-responses

Preview • Updated Jun 2 • 179

inference-optimization/gpt-oss-120b-responses

Preview • Updated Jun 2 • 130

View 28 datasets