模板類 Int8Calibrator¶

繼承關係¶

template<typename Algorithm, typename DataLoaderUniquePtr> class Int8Calibrator : private Algorithm ¶

基於指定的 TensorRT 校準演算法和 LibTorch DataLoader 的通用 Int8Calibrator 實現。

模板引數

Algorithm – 類 nvinfer1::IInt8Calibrator（預設：nvinfer1::IInt8EntropyCalibrator2）- 要使用的演算法
DataLoaderUniquePtr – std::unique_ptr<torch::data::DataLoader> - DataLoader 型別

公共函式

inline Int8Calibrator(DataLoaderUniquePtr dataloader, const std::string &cache_file_path, bool use_cache)¶

構造一個新的 Int8Calibrator 物件。

使用提供的 DataLoader 構造一個可用於 Torch-TensorRT 進行 PTQ 的校準器

引數

dataloader – std::unqiue_ptr<torch::data::DataLoader> - 指向 DataLoader 的唯一指標，應為 make_data_loader 工廠返回的值
cache_file_path – const std::string& - 儲存/查詢校準快取的路徑
use_cache – : bool - 是否使用快取（如果存在）

inline int getBatchSize() const noexcept override¶

獲取下一批次的批次大小（由於 TRT 和顯式批次的問題，始終為 1）

inline bool getBatch(void *bindings[], const char *names[], int nbBindings) noexcept override¶

獲取下一批次資料。

引數

返回值

true - 校準器有新的批次資料可消耗

返回值

false - 校準器沒有新的批次資料可消耗

inline const void *readCalibrationCache(size_t &length) noexcept override¶

讀取校準快取。

如何從校準快取中讀取，僅在使用 use_cache 設定時啟用

inline void writeCalibrationCache(const void *cache, size_t length) noexcept override¶

寫入校準快取。

將 TensorRT 提供的校準快取寫入指定檔案

引數

inline operator nvinfer1::IInt8Calibrator*()¶

轉換為 nvinfer1::IInt8Calibrator* 的運算子

方便的函式，轉換為 IInt8Calibrator*，以便輕鬆分配給 CompileSpec 中的 ptq_calibrator 欄位