快捷方式

torchaudio.functional.sliding_window_cmn

torchaudio.functional.sliding_window_cmn(specgram: Tensor, cmn_window: int = 600, min_cmn_window: int = 100, center: bool = False, norm_vars: bool = False) Tensor[原始碼]

對每個語段應用滑動視窗倒譜均值(可選方差)歸一化。

This feature supports the following devices: CPU, CUDA This API supports the following properties: TorchScript
引數:
  • specgram (Tensor) – 維度為 (…, time, freq) 的聲譜圖 Tensor

  • cmn_window (int, 可選) – 用於計算移動平均 CMN 的幀視窗大小(int,預設值 = 600)

  • min_cmn_window (int, 可選) – 解碼開始時使用的最小 CMN 視窗(僅在開始時增加延遲)。僅當 center == false 時適用,如果 center==true 則忽略(int,預設值 = 100)

  • center (bool, 可選) – 如果為 true,則使用以當前幀為中心的視窗(儘可能地,考慮到末端效應)。如果為 false,則視窗在左側。(bool,預設值 = false)

  • norm_vars (bool, 可選) – 如果為 true,則將方差歸一化為一。(bool,預設值 = false)

返回:

與輸入形狀 (…, freq, time) 匹配的 Tensor

返回型別:

Tensor

文件

獲取 PyTorch 的全面開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源