siqi's picture

1

siqi

lisiqi007

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks

Paper • 2604.08865 • Published Apr 10 • 29