HumanistAtypik (HumanistAtypik)

liked a model 2 months ago

mistralai/Mistral-Large-3-675B-Instruct-2512

Updated Dec 19, 2025 • 547 • 204

liked a Space 2 months ago

Image Arena Leaderboard

📊

574

Image Generation and Image Editing Arena & Leaderboard

liked a model 3 months ago

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated Dec 23, 2025 • 409k • • 1.47k

liked a model 4 months ago

DragonLLM/Dragon-3B-Base-alpha

4B • Updated Dec 12, 2025 • 12 • 7

liked a Space 4 months ago

LLM Performance Leaderboard

🐨

438

Compare and rank large language model performance

liked 2 datasets 4 months ago

theResearchNinja/violentutf_cybersecurityBehavior

Viewer • Updated Jun 12, 2024 • 10k • 15 • 3

CounterBench/CounterBench

Preview • Updated Aug 4, 2025 • 60 • 1

liked 9 Spaces 4 months ago

Open VLM Video Leaderboard

🌎

130

VLMEvalKit Eval Results in video understanding benchmark

WebWalkerQALeaderboard

🥇

10

Display leaderboard for AI models

LVBench Leaderboard

🐨

16

Submit and view model evaluations

Chatbot Arena

💬

225

Display text leaderboard

LMArena Leaderboard

🏆

4.71k

Compare and rank AI model performance

Fey's Multi-Needle & Behavior Leaderboard

📊

34

Fey's Multi-Needle & Behavior Leaderboard

Agent Leaderboard

💬

444

Ranking of LLMs for agentic tasks

UGI Leaderboard

📢

1.47k

Uncensored General Intelligence Leaderboard

DNR-Bench

⚡

2

DNR-Bench leaderboard for RLM's

liked a model 4 months ago

ServiceNow-AI/Apriel-1.5-15b-Thinker

Image-Text-to-Text • 15B • Updated Oct 6, 2025 • 468 • 464

liked a Space 4 months ago

GPU Poor LLM Arena

🏆

349

Compact LLM Battle Arena: Frugal AI Face-Off!

liked 2 datasets 4 months ago

cais/hle

Benchmark • Updated 20 days ago • 2.5k • 23.4k • 694

cais/hle-rolling

Viewer • Updated Oct 7, 2025 • 2.48k • 152 • 13

HumanistAtypik

AI & ML interests

Organizations

mistralai/Mistral-Large-3-675B-Instruct-2512

Image Arena Leaderboard

MiniMaxAI/MiniMax-M2

DragonLLM/Dragon-3B-Base-alpha

LLM Performance Leaderboard

theResearchNinja/violentutf_cybersecurityBehavior

CounterBench/CounterBench

Open VLM Video Leaderboard

WebWalkerQALeaderboard

LVBench Leaderboard

Chatbot Arena

LMArena Leaderboard

Fey's Multi-Needle & Behavior Leaderboard

Agent Leaderboard

UGI Leaderboard

DNR-Bench

ServiceNow-AI/Apriel-1.5-15b-Thinker

GPU Poor LLM Arena

cais/hle

cais/hle-rolling

HumanistAtypik

AI & ML interests

Organizations

HumanistAtypik's activity

Image Arena Leaderboard

LLM Performance Leaderboard

Open VLM Video Leaderboard

WebWalkerQALeaderboard

LVBench Leaderboard

Chatbot Arena

LMArena Leaderboard

Fey's Multi-Needle & Behavior Leaderboard

Agent Leaderboard

UGI Leaderboard

DNR-Bench

GPU Poor LLM Arena