PKU-DS-LAB's picture

PKU-DS-LAB PRO

Lab1806

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 17 days ago

Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents

upvoted a paper 3 months ago

BABE: Biology Arena BEnchmark

liked a Space 4 months ago

nanotron/ultrascale-playbook

View all activity

Organizations

upvoted a paper 17 days ago

Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents

Paper • 2604.06132 • Published 19 days ago • 117

upvoted a paper 3 months ago

BABE: Biology Arena BEnchmark

Paper • 2602.05857 • Published Feb 5 • 10

upvoted a paper 11 months ago

HardTests: Synthesizing High-Quality Test Cases for LLM Coding

Paper • 2505.24098 • Published May 30, 2025 • 43

upvoted a collection 11 months ago

FairyR1

2 items • Updated May 27, 2025 • 9