快捷方式

WorldModelWrapper

class torchrl.modules.tensordict_module.WorldModelWrapper(*args, **kwargs)[source]

世界模型包裝器。

該模組封裝了轉移模型和獎勵模型。轉移模型用於預測一個假想的世界狀態。獎勵模型用於預測假想轉移的獎勵。

引數:
  • transition_model (TensorDictModule) – 生成新世界狀態的轉移模型。

  • reward_model (TensorDictModule) – 讀取世界狀態並返回獎勵的獎勵模型。

get_reward_operator() TensorDictModule[source]

返回一個獎勵操作器,該操作器將世界狀態對映到獎勵。

get_transition_model_operator() TensorDictModule[source]

返回一個轉移操作器,該操作器將觀測值對映到世界狀態,或將當前世界狀態對映到下一個世界狀態。

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源