DataCollectorBase
-
class torchrl.collectors.DataCollectorBase[source]
資料收集器的基類。
-
update_policy_weights_(policy_weights: Optional[TensorDictBase] = None) → None[source]
如果資料收集器的策略和訓練後的策略位於不同的裝置上,則更新策略權重。
- 引數:
policy_weights (TensorDictBase, optional) – 如果提供,則是一個 TensorDict,包含用於更新的策略權重。