BackendPatternConfig¶
- class torch.ao.quantization.backend_config.BackendPatternConfig(pattern=None)[source][source]¶
配置物件,指定給定運算元模式的量化行為。有關詳細用法示例,請參見
BackendConfig。- classmethod from_dict(backend_pattern_config_dict)[source][source]¶
從一個字典建立
BackendPatternConfig,字典包含以下項“pattern”: 正在配置的模式 “observation_type”: 指定如何為該模式插入觀察者的
ObservationType“dtype_configs”: 表示DTypeConfig列表的字典列表 “root_module”: 表示該模式根部的torch.nn.Module“qat_module”: 表示該模式 QAT 實現的torch.nn.Module“reference_quantized_module”: 表示該模式根模組的參考量化實現的torch.nn.Module“fused_module”: 表示該模式融合實現的torch.nn.Module“fuser_method”: 指定如何融合該模式的函式 “pattern_complex_format”: 以反向巢狀元組格式指定的模式 (已棄用)- 返回型別
- set_fuser_method(fuser_method)[source][source]¶
設定指定如何融合此 BackendPatternConfig 模式的函式。
該函式的第一個引數應為 is_qat,其餘引數應為元組模式中的項。該函式的返回值應為融合後的模組。
例如,模式 (torch.nn.Linear, torch.nn.ReLU) 的融合函式可以是
- def fuse_linear_relu(is_qat, linear, relu)
return torch.ao.nn.intrinsic.LinearReLU(linear, relu)
有關更復雜的示例,請參見 https://gist.github.com/jerryzh168/8bea7180a8ba3c279f2c9b050f2a69a6。
- 返回型別
- set_observation_type(observation_type)[source][source]¶
設定如何將觀察者插入到此模式的圖中。
此處觀察型別指的是如何在圖中放置觀察者(或量化-反量化操作)。這用於生成後端理解的所需參考模式。加權操作(例如線性層和卷積層)對於輸入和輸出需要不同的觀察者(或傳遞給參考模型中量化操作的量化引數)。
有兩種觀察型別
OUTPUT_USE_DIFFERENT_OBSERVER_AS_INPUT (預設): 輸出觀察者例項將與輸入不同。這是最常見的觀察型別。
OUTPUT_SHARE_OBSERVER_WITH_INPUT: 輸出觀察者例項將與輸入相同。這對於像 cat 這樣的運算元很有用。
注意:這將在不久的將來重新命名,因為我們很快將插入帶有觀察者(和偽量化)的 QuantDeQuantStubs,而不是直接插入觀察者本身。
- 返回型別
- set_pattern(pattern)[source][source]¶
設定要配置的模式。
模式可以是浮點模組、函式式運算元、PyTorch 運算元或以上各項的元組組合。元組模式被視為序列模式,目前僅支援由 2 或 3 個元素組成的元組。
- 返回型別
- set_reference_quantized_module(reference_quantized_module)[source][source]¶
設定表示此模式根模組的參考量化實現的模組。
有關更多詳細資訊,請參見
set_root_module()。- 返回型別