DTLoss¶
- class torchrl.objectives.DTLoss(*args, **kwargs)[原始碼]¶
TorchRL 實現的線上 Decision Transformer 損失函式。
在 “Decision Transformer: Reinforcement Learning via Sequence Modeling” <https://arxiv.org/abs/2106.01345> 中提出
- 引數:
actor_network (ProbabilisticActor) – 隨機執行者網路
- 關鍵字引數:
loss_function (str) – 要使用的損失函式。預設為
"l2"。reduction (str, optional) – 指定應用於輸出的歸約方式:
"none"|"mean"|"sum"。"none":不應用歸約,"mean":輸出的總和除以輸出中的元素數量,"sum":對輸出求和。預設為"mean"。
- default_keys¶
_AcceptedKeys的別名