torchaudio.functional.sliding_window_cmn¶

torchaudio.functional.sliding_window_cmn(specgram: Tensor, cmn_window: int = 600, min_cmn_window: int = 100, center: bool = False, norm_vars: bool = False) → Tensor[原始碼]¶

對每個語段應用滑動視窗倒譜均值（可選方差）歸一化。

引數：

specgram (Tensor) – 維度為 (…, time, freq) 的聲譜圖 Tensor
cmn_window (int, 可選) – 用於計算移動平均 CMN 的幀視窗大小（int，預設值 = 600）
min_cmn_window (int, 可選) – 解碼開始時使用的最小 CMN 視窗（僅在開始時增加延遲）。僅當 center == false 時適用，如果 center==true 則忽略（int，預設值 = 100）
center (bool, 可選) – 如果為 true，則使用以當前幀為中心的視窗（儘可能地，考慮到末端效應）。如果為 false，則視窗在左側。（bool，預設值 = false）
norm_vars (bool, 可選) – 如果為 true，則將方差歸一化為一。（bool，預設值 = false）

返回：

與輸入形狀 (…, freq, time) 匹配的 Tensor

返回型別：

Tensor

torchaudio.functional.sliding_window_cmn¶

文件

教程

資源