torchaudio.functional.compute_deltas¶

torchaudio.functional.compute_deltas(specgram: Tensor, win_length: int = 5, mode: str = 'replicate') → Tensor[原始碼]¶

計算張量的 delta 係數，通常用於頻譜圖

\[d_t = \frac{\sum_{n=1}^{\text{N}} n (c_{t+n} - c_{t-n})}{2 \sum_{n=1}^{\text{N}} n^2} \]

其中 \(d_t\) 是時間 \(t\) 處的 delta，\(c_t\) 是時間 \(t\) 處的頻譜圖係數，\(N\) 是 (win_length-1)//2。

引數：

返回：

維度為 (…, 頻率, 時間) 的 delta 張量

返回型別：

Tensor

示例

>>> specgram = torch.randn(1, 40, 1000)
>>> delta = compute_deltas(specgram)
>>> delta2 = compute_deltas(delta)

文件