快捷方式

BinarizeReward

class torchrl.envs.transforms.BinarizeReward(in_keys: Sequence[NestedKey] | None = None, out_keys: Sequence[NestedKey] | None = None)[source]

將獎勵對映為二元值(0 或 1),分別對應獎勵為空或非空的情況。

引數:
  • in_keys (List[NestedKey]) – 輸入鍵

  • out_keys (List[NestedKey], optional) – 輸出鍵。預設為 in_keys 的值。

  • dtype (torch.dtype, optional) – 二值化獎勵的資料型別。預設為 torch.int8

transform_reward_spec(reward_spec: TensorSpec) TensorSpec[source]

變換獎勵規格,使其結果與變換對映匹配。

引數:

reward_spec (TensorSpec) – 變換前的規格

返回:

變換後的預期規格

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並解答你的問題

檢視資源