快捷方式

MarlinSparseLayout

torchao.dtypes.MarlinSparseLayout[原始碼]

MarlinSparseLayout 是一種佈局類,用於處理專門為 Marlin 稀疏核設計的稀疏張量格式。這種佈局用於最佳化具有 2:4 稀疏模式的仿射量化張量的儲存和計算。

該佈局確保張量資料經過預處理並存儲在與 Marlin 稀疏核操作相容的格式中。它提供了預處理輸入張量和管理量化張量佈局的方法。

pre_process(輸入: 張量) 張量[原始碼]
預處理輸入張量,使其符合 Marlin 稀疏核所需的格式。
  • 1º: 輸入張量被轉置,因為線性層將權重儲存在轉置格式中

  • 2º: 張量被注入 2:4 稀疏性

  • 3º: 再次轉置,因為量化過程將計算 dim=-1 的尺度

引數:

input (torch.Tensor) – 要預處理的輸入張量

返回:

預處理後的張量

返回型別:

torch.Tensor

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源