🔄 In a Training Loop

Pratyay Banerjee

Neilblaze

·

https://neilblaze.live

AI & ML interests

IR, NLP, Pattern Recognition, xAI, Interpretability, Evals

Recent Activity

liked a Space 3 days ago

nvidia/nemotron-labs-audio-visual-flamingo

liked a model 3 days ago

asinha08/slm-125m-base

liked a model 3 days ago

asinha08/slm-125m-sft-pilot-2k

View all activity

Organizations

liked a Space 3 days ago

Nemotron-Labs-Audio-Visual Flamingo

Analyze videos and answer questions about their content

liked 2 models 3 days ago

asinha08/slm-125m-base

Text Generation • 0.1B • Updated 20 days ago • 564 • 3

asinha08/slm-125m-sft-pilot-2k

Text Generation • 0.1B • Updated 19 days ago • 500 • 2

liked a dataset 3 days ago

HuggingFaceCode/stack-v3-train

Preview • Updated 2 days ago • 103k • 249

liked a model 3 days ago

nvidia/Nemotron-3-Nano-Omni-30B-A3B-Reasoning-BF16

Any-to-Any • 33B • Updated May 8 • 512k • 404

upvoted 7 papers 4 days ago

Loop the Loopies!

Paper • 2607.16051 • Published 14 days ago • 74

SWE-Pruner Pro: The Coder LLM Already Knows What to Prune

Paper • 2607.18213 • Published 11 days ago • 78

DeepSearch-World: Self-Distillation for Deep Search Agents in a Verifiable Environment

Paper • 2607.07820 • Published 23 days ago • 91

SEED: Self-Evolving On-Policy Distillation for Agentic Reinforcement Learning

Paper • 2607.14777 • Published 15 days ago • 103

RAGU: A Multi-Step GraphRAG Engine with a Compact Domain-Adapted LLM

Paper • 2607.11683 • Published 18 days ago • 148

AREX: Towards a Recursively Self-Improving Agent for Deep Research

Paper • 2607.21461 • Published 8 days ago • 149

Program-as-Weights: A Programming Paradigm for Fuzzy Functions

Paper • 2607.02512 • Published 29 days ago • 238

liked a model 4 days ago

owensong/Inflect-Micro-v2

Text-to-Speech • Updated about 5 hours ago • 1.1k • 329

liked a model 5 days ago

meta-llama/Llama-3.1-8B-Instruct

Text Generation • 8B • Updated Sep 25, 2024 • 7.93M • • 6.43k

upvoted 2 articles 6 days ago

Article

One Adapter, Both Modalities: Field Notes from Building and Serving a Multimodal Reranker

lightonai

•

15 days ago

• 18

Article

Bringing Nunchaku 4-bit Diffusion Inference to Diffusers

rootonchair, sayakpaul

•

8 days ago

• 60

liked 2 models 7 days ago

microsoft/harrier-oss-v1-270m

Feature Extraction • 0.3B • Updated Mar 30 • 198k • • 188

LiquidAI/LFM2.5-350M

Text Generation • 0.4B • Updated 22 days ago • 93.2k • 384

liked a Space 7 days ago

LFM2.5 WebGPU Summarizer

Summarize webpages locally in your browser (demo)

liked a model 7 days ago

nvidia/Nemotron-3-Embed-1B-BF16

Sentence Similarity • 1B • Updated 10 days ago • 400k • • 123