HardUpdate¶
- 類 torchrl.objectives.HardUpdate(loss_module: Union['DQNLoss', 'DDPGLoss', 'SACLoss', 'TD3Loss'], *, value_network_update_interval: float = 1000)[原始碼]¶
一個硬更新類,用於 Double DQN/DDPG 中的目標網路更新(與軟更新相對)。
這在原始的 Double DQN 論文中提出:“Deep Reinforcement Learning with Double Q-learning”,https://arxiv.org/abs/1509.06461。