torch_tensorrt.ts.ptq¶
這些元件是設計用於 TorchScript 前端的遺留量化工具。它們已被 TensorRT Model Optimizer 工具包取代,該工具包可與 dynamo 前端一起使用
類¶
- class torch_tensorrt.ts.ptq.DataLoaderCalibrator(*args: Any, **kwargs: Any)[原始碼]¶
在 TensorRT 中構造一個校準器類,並使用 pytorch dataloader 載入/預處理在校準期間傳遞的資料。
- 引數
dataloader (torch.utils.data.DataLoader) – pytorch dataloader 的一個例項,用於遍歷給定資料集。
algo_type (CalibrationAlgo) – 校準演算法的選擇。
cache_file (str) – 快取檔案路徑。
use_cache (bool) – 啟用使用預存在快取的標誌。
device (Device) – 校準資料複製到的裝置。
- class torch_tensorrt.ts.ptq.CacheCalibrator(*args: Any, **kwargs: Any)[原始碼]¶
在 TensorRT 中構造一個校準器類,該類直接使用預存在快取檔案進行校準。
- 引數
cache_file (str) – 快取檔案路徑。
algo_type (CalibrationAlgo) – 校準演算法的選擇。
列舉¶
- class torch_tensorrt.ts.ptq.CalibrationAlgo(value, names=None, *, module=None, qualname=None, type=None, start=1, boundary=None)[原始碼]¶
- ENTROPY_CALIBRATION = <CalibrationAlgo.ENTROPY_CALIBRATION: 1>¶
- ENTROPY_CALIBRATION_2 = <CalibrationAlgo.ENTROPY_CALIBRATION_2: 2>¶
- LEGACY_CALIBRATION = <CalibrationAlgo.LEGACY_CALIBRATION: 0>¶
- MINMAX_CALIBRATION = <CalibrationAlgo.MINMAX_CALIBRATION: 3>¶