快捷方式

choose_qparams_affine_with_min_max

torchao.quantization.choose_qparams_affine_with_min_max(min_val: Tensor, max_val: Tensor, mapping_type: MappingType, block_size: Tuple[int, ...], target_dtype: dtype, quant_min: Optional[int] = None, quant_max: Optional[int] = None, eps: Optional[float] = None, scale_dtype: Optional[dtype] = None, zero_point_dtype: Optional[dtype] = None, preserve_zero: bool = True, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT) Tuple[Tensor, Tensor][source]

`choose_qparams_affine()` 運算元的一個變體,直接傳入 min_val 和 max_val,而不是從單個輸入中匯出它們。這用於靜態量化中的觀察者,其中 min_val 和 max_val 可能透過跟蹤校準資料集中的所有資料來獲得。

:param 大部分與 `choose_qparams_affine()` 相同。有一個: :param 區別:我們不是傳入 `input` 張量並用它來計算 min_val/max_val :param 然後計算 scale/zero_point: :param 而是直接傳入 min_val/max_val

文件

獲取 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和進階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源