int_scaled_matmul¶
- torchao.quantization.int_scaled_matmul(a: Tensor, b: Tensor, scales1: Tensor) Tensor[source]¶
執行縮放的整數矩陣乘法。
- 引數:
a (torch.Tensor) – 要相乘的第一個矩陣。
b (torch.Tensor) – 要相乘的第二個矩陣。
scales1 (torch.Tensor) – 結果行上的縮放因子。
- 返回:
縮放矩陣乘法的結果。
- 返回型別:
- 丟擲:
AssertionError – 如果輸入張量的維度與預期形狀不匹配。