stable-baselines3

Name: stable-baselines3
Brand: MuleRun
Author: Daniel Avila

by Daniel Avila

19,6600Feb 6, 2026Visit Source

Use this skill for reinforcement learning tasks including training RL agents (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), creating custom Gym environments, implementing callbacks for monitoring and control, using vectorized environments for parallel training, and integrating with deep RL workflows. This skill should be used when users request RL algorithm implementation, agent training, environment design, or RL experimentation.