Jeff Gao's picture

1 14 6

Jeff Gao

jeff-gao

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

upvoted a paper 14 days ago

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

upvoted a paper 28 days ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

View all activity

Organizations

None yet

upvoted 2 papers 14 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

Paper • 2601.22975 • Published 18 days ago • 99

ASTRA: Automated Synthesis of agentic Trajectories and Reinforcement Arenas

Paper • 2601.21558 • Published 19 days ago • 58

upvoted a paper 28 days ago

DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation

Paper • 2601.09688 • Published Jan 14 • 126

upvoted 2 papers about 1 month ago

User-Oriented Multi-Turn Dialogue Generation with Tool Use at scale

Paper • 2601.08225 • Published Jan 13 • 52

Benchmark^2: Systematic Evaluation of LLM Benchmarks

Paper • 2601.03986 • Published Jan 7 • 34

upvoted a paper 3 months ago

DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation

Paper • 2511.06307 • Published Nov 9, 2025 • 53

upvoted a paper 6 months ago

Evaluating, Synthesizing, and Enhancing for Customer Support Conversation

Paper • 2508.04423 • Published Aug 6, 2025 • 9

upvoted a paper 8 months ago

EmoNet-Voice: A Fine-Grained, Expert-Verified Benchmark for Speech Emotion Detection

Paper • 2506.09827 • Published Jun 11, 2025 • 21

upvoted 3 papers over 1 year ago

General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model

Paper • 2409.01704 • Published Sep 3, 2024 • 83

Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On

Paper • 2407.08348 • Published Jul 11, 2024 • 52

LoRA Learns Less and Forgets Less

Paper • 2405.09673 • Published May 15, 2024 • 91

upvoted 2 papers almost 2 years ago

Stealing Part of a Production Language Model

Paper • 2403.06634 • Published Mar 11, 2024 • 91

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1, 2024 • 85

upvoted a paper about 2 years ago

BASE TTS: Lessons from building a billion-parameter Text-to-Speech model on 100K hours of data

Paper • 2402.08093 • Published Feb 12, 2024 • 62