快捷方式

make_collector_offpolicy

torchrl.trainers.helpers.make_collector_offpolicy(make_env: Callable[[], EnvBase], actor_model_explore: Union[TensorDictModuleWrapper, ProbabilisticTensorDictSequential], cfg: DictConfig, make_env_kwargs: Optional[Dict] = None) DataCollectorBase[原始碼]

為非策略 (off-policy) sota-實現返回資料收集器。

引數:
  • make_env (Callable) – 環境建立器

  • actor_model_explore (SafeModule) – 用於評估和探索更新的模型例項

  • cfg (DictConfig) – 用於建立收集器物件的配置

  • make_env_kwargs (dict) – 環境建立器的 kwargs 引數

文件

查閱 PyTorch 的綜合開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源