BinarizeReward¶
- class torchrl.envs.transforms.BinarizeReward(in_keys: Sequence[NestedKey] | None = None, out_keys: Sequence[NestedKey] | None = None)[source]¶
將獎勵對映為二元值(0 或 1),分別對應獎勵為空或非空的情況。
- 引數:
in_keys (List[NestedKey]) – 輸入鍵
out_keys (List[NestedKey], optional) – 輸出鍵。預設為
in_keys的值。dtype (torch.dtype, optional) – 二值化獎勵的資料型別。預設為
torch.int8。
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec[source]¶
變換獎勵規格,使其結果與變換對映匹配。
- 引數:
reward_spec (TensorSpec) – 變換前的規格
- 返回:
變換後的預期規格