快捷方式

DataCollectorBase

class torchrl.collectors.DataCollectorBase[source]

資料收集器的基類。

update_policy_weights_(policy_weights: Optional[TensorDictBase] = None) None[source]

如果資料收集器的策略和訓練後的策略位於不同的裝置上,則更新策略權重。

引數:

policy_weights (TensorDictBase, optional) – 如果提供,則是一個 TensorDict,包含用於更新的策略權重。


© 版權所有 2022, Meta。

使用 Sphinx 構建,主題由 Read the Docs 提供。

文件

訪問 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得解答

檢視資源