transformed_env_constructor¶
- torchrl.trainers.helpers.transformed_env_constructor(cfg: DictConfig, video_tag: str = '', logger: Optional[Logger] = None, stats: Optional[dict] = None, norm_obs_only: bool = False, use_env_creator: bool = True, custom_env_maker: Optional[Callable] = None, custom_env: Optional[EnvBase] = None, return_transformed_envs: bool = True, action_dim_gsde: Optional[int] = None, state_dim_gsde: Optional[int] = None, batch_dims: Optional[int] = 0, obs_norm_state_dict: Optional[dict] = None) Union[Callable, EnvCreator][source]¶
根據使用適當的解析器建構函式構建的 argparse.Namespace 返回一個環境建立器。
- 引數:
cfg (DictConfig) – 一個包含指令碼引數的 DictConfig。
video_tag (str, optional) – 要傳遞給 Logger 物件的影片標籤
logger (Logger, optional) – 與指令碼關聯的 logger
stats (dict, optional) – 一個包含
loc和scale用於 ObservationNorm transform 的字典norm_obs_only (bool, optional) – 如果為 True 且使用了 VecNorm,則獎勵不會線上進行歸一化。預設為 False。
use_env_creator (bool, optional) – 是否應使用 EnvCreator 類。透過使用 EnvCreator,可以確保在使用 VecNorm transform 時,執行統計資料將被放入共享記憶體並可供所有 worker 訪問。預設為 True。
custom_env_maker (callable, optional) – 如果你的環境建立器不是 torchrl 環境包裝器的一部分,可以傳遞一個自定義的可呼叫物件。在這種情況下,它將覆蓋從 args 中檢索到的建構函式。
custom_env (EnvBase, optional) – 如果需要對現有環境進行 transformed_in,可以直接將其傳遞給此 helper。custom_env_maker 和 custom_env 是互斥的特性。
return_transformed_envs (bool, optional) – 如果
True,則返回一個 transformed_in 環境。action_dim_gsde (int, Optional) – 如果使用 gSDE,這可以表示用於初始化噪聲的動作維度。請確保在並行執行的環境中指示此值。
state_dim_gsde – 如果使用 gSDE,這可以表示用於初始化噪聲的狀態維度。請確保在並行執行的環境中指示此值。
batch_dims (int, optional) – 資料批次的維度數。如果使用單個環境,應設定為 0(預設)。如果多個環境並行進行 transformed,應設定為 1(或批次的維度數)。
obs_norm_state_dict (dict, optional) – 要載入到環境中的 ObservationNorm transform 的 state_dict