Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

policy-gradient

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

18

Full-text search

Active filters: policy-gradient

convergedmachine/Policy-Gradient-Noise-Mask

Reinforcement Learning • Updated Jan 23, 2025

winkin119/Reinforce-CartPole

Reinforcement Learning • Updated Aug 3, 2025

winkin119/A2C-GAE-CartPoleV1

Reinforcement Learning • Updated Aug 3, 2025

winkin119/A2C-GAE-LunarLanderV3

Reinforcement Learning • Updated Aug 4, 2025

winkin119/A3C-CartPoleV1

Reinforcement Learning • Updated Aug 3, 2025

winkin119/A3C-LunarLanderV3

Reinforcement Learning • Updated Aug 4, 2025

winkin119/TD3-PendulumV1

Reinforcement Learning • Updated Aug 4, 2025

winkin119/TD3-Walker2dV5

Reinforcement Learning • Updated Aug 5, 2025

winkin119/SAC-PendulumV1

Reinforcement Learning • Updated Aug 3, 2025 • 1

winkin119/SAC-Walker2dV5

Reinforcement Learning • Updated Aug 3, 2025

winkin119/Curiosity-MountainCarV0

Reinforcement Learning • Updated Aug 3, 2025

emiliogodigital/reinforce-CartPole-v1-old

Reinforcement Learning • Updated Oct 1, 2025

emiliogodigital/reinforce-CartPole-v1_2

Reinforcement Learning • Updated Oct 2, 2025

dgraha15/reinforce-cartpole-v1

Updated Nov 24, 2025 • 1

ImaghT/reinforce-CartPole-v1

Reinforcement Learning • Updated Dec 21, 2025 • 3

ImaghT/reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated Dec 22, 2025 • 11

metapat973/Reinforce-Pixelcopter-PLE-v0

Reinforcement Learning • Updated 22 days ago

Heshwa/flappy-bird-reinforce-v1

Reinforcement Learning • Updated 12 days ago