13 9 132

Pritish Mishra

pritish

AI & ML interests

Machine Learning, Computer Vision, NLP, ODML, ML Ops

Recent Activity

liked a model 3 days ago

Qwen/Qwen3.5-397B-A17B

upvoted an article 4 days ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a model 22 days ago

arcee-ai/Trinity-Large-Preview

View all activity

Organizations

None yet

liked a model 3 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 3 days ago • 46.8k • • 680

upvoted an article 4 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

Jan 30, 2025

•

233

liked a model 22 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • Updated 12 days ago • 1.8k • 142

upvoted an article 23 days ago

Article

Transformers v5: Simple model definitions powering the AI ecosystem

Dec 1, 2025

•

298

liked 6 models about 1 month ago

upvoted a collection 2 months ago

NVIDIA Nemotron v3

Collection

Open, Production-ready Enterprise Models • 7 items • Updated 14 days ago • 140

liked 4 models 3 months ago

arcee-ai/Trinity-Mini

Text Generation • Updated Dec 11, 2025 • 7.53k • • 178

nari-labs/Dia2-2B

Text-to-Speech • Updated Dec 1, 2025 • 8.94k • 157

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated 1 day ago • 1.08k • 521

moonshotai/Kimi-K2-Thinking

Text Generation • Updated 20 days ago • 315k • • 1.67k

liked 4 models 4 months ago

unsloth/Qwen3-14B

Updated May 13, 2025 • 19.7k • 15

unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF

31B • Updated Jul 31, 2025 • 55.3k • 288

deepseek-ai/DeepSeek-OCR

Image-Text-to-Text • Updated Nov 4, 2025 • 3.13M • 3.15k

google/embeddinggemma-300m

liked a model 5 months ago

Qwen/Qwen3-30B-A3B-Instruct-2507-FP8

Text Generation • 31B • Updated Sep 17, 2025 • 745k • 112

Pritish Mishra

AI & ML interests

Recent Activity

Organizations

pritish's activity

KV Caching Explained: Optimizing Transformer Inference Efficiency

Transformers v5: Simple model definitions powering the AI ecosystem