PingchengDong's picture

2 5

PingchengDong

heisei

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

liked a model 3 months ago

nvidia/DLER-R1-7B-Research

liked a model 3 months ago

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

View all activity

Organizations

None yet

upvoted a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published Jan 8 • 228

liked 3 models 3 months ago

nvidia/DLER-R1-7B-Research

8B • Updated Oct 25, 2025 • 358 • 15

nvidia/DLER-Llama-Nemotron-8B-Merge-Research

8B • Updated Oct 25, 2025 • 34 • 15

nvidia/DLER-R1-1.5B-Research

2B • Updated Oct 25, 2025 • 21.3k • 17

upvoted a collection 4 months ago

Reasoning Efficiency Research

Ultra-efficient reasoning model! SOTA Accuracy / CoT Length trade-offs • 3 items • Updated 2 days ago • 11

liked a model almost 2 years ago

Palak/albert-base-v2_squad

Question Answering • Updated Dec 24, 2021 • 6 • 1

liked a Space almost 2 years ago

Depth Anything

Generate depth maps from your photos