DreamerValueLoss¶
- class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[source]¶
Dreamer 值函式損失。
計算 Dreamer 值函式模型的損失。值函式損失計算的是預測值與 lambda 目標之間的差。
參考:https://arxiv.org/abs/1912.01603。
- 引數:
value_model (TensorDictModule) – 值函式模型。
value_loss (str, optional) – 用於計算值函式損失的損失函式。預設為
"l2"。discount_loss (bool, optional) – 如果為
True,則損失會使用 gamma 折扣因子進行折扣。預設為 False。gamma (
float, optional) – gamma 折扣因子。預設為0.99。
- default_keys¶
_AcceptedKeys的別名