torchaudio.functional¶
用於執行常見音訊操作的函式。
工具¶
將頻譜圖從功率/幅度尺度轉換為分貝尺度。 |
|
將張量從分貝尺度轉換為功率/幅度尺度。 |
|
建立頻率 bin 轉換矩陣。 |
|
建立線性三角濾波器組。 |
|
建立形狀為 ( |
|
沿 |
|
沿 |
|
基於 mu-law 壓擴對訊號進行編碼。 |
|
解碼 mu-law 編碼訊號。 |
|
已棄用:應用編解碼器作為一種增強形式。 |
|
使用帶限插值以新頻率對波形進行重取樣。 |
|
根據 ITU-R BS.1770-4 建議測量音訊響度。 |
|
使用直接方法沿其最後一個維度卷積輸入。 |
|
使用 FFT 沿其最後一個維度卷積輸入。 |
|
根據信噪比縮放波形並新增噪聲。 |
|
沿其最後一個維度對波形進行預加重,即對於 |
|
沿其最後一個維度對波形進行去加重。 |
|
調整波形速度。 |
|
計算兩個多元正態分佈之間的 Fréchet 距離 [Dowson and Landau, 1982]。 |
強制對齊¶
將 CTC 標籤序列與發射對齊。 |
|
從給定的 CTC 令牌序列中移除重複令牌和空白令牌。 |
|
帶時間戳和分數的令牌。 |
濾波¶
設計二階全通濾波器。 |
|
設計二階帶濾波器。 |
|
設計二階帶通濾波器。 |
|
設計二階帶阻濾波器。 |
|
設計低音音調控制效果。 |
|
對輸入張量執行雙二階濾波。 |
|
應用對比度效果。 |
|
對音訊應用直流偏移。 |
|
應用 ISO 908 CD 去加重(擱架式)IIR 濾波器。 |
|
應用抖動 |
|
設計雙二階峰值均衡器濾波器並執行濾波。 |
|
對波形應用 IIR 濾波器前向和後向濾波。 |
|
對音訊應用鑲邊效果。 |
|
對整個波形應用放大或衰減。 |
|
設計雙二階高通濾波器並執行濾波。 |
|
透過評估差分方程執行 IIR 濾波,使用由 Yu 等人 [Yu and Fazekas, 2023] 和 Forgione 等人 [Forgione and Piga, 2021] 獨立開發的可微分實現。 |
|
設計雙二階低通濾波器並執行濾波。 |
|
對音訊應用過載效果。 |
|
對音訊應用移相效果。 |
|
應用 RIAA 唱片播放均衡。 |
|
設計高音音調控制效果。 |
特徵提取¶
語音活動檢測器。 |
|
從原始音訊訊號建立頻譜圖或一批頻譜圖。 |
|
從提供的複數值頻譜圖建立逆頻譜圖或一批逆頻譜圖。 |
|
使用 Griffin-Lim 變換從線性幅度頻譜圖計算波形。 |
|
給定一個 STFT 張量,透過因子 |
|
將波形的音高偏移 |
|
計算張量的 delta 係數,通常是頻譜圖 |
|
檢測音高頻率。 |
|
按話語應用滑動視窗倒譜均值(和可選方差)歸一化。 |
|
沿時間軸計算每個通道的頻譜質心。 |
多通道¶
計算跨通道功率譜密度 (PSD) 矩陣。 |
|
根據 Souden 等人 [Souden 等人, 2009] 提出的方法計算最小方差無失真響應 (MVDR [Capon, 1969]) 波束形成權重。 |
|
根據相對傳遞函式 (RTF) 和噪聲功率譜密度 (PSD) 矩陣計算最小方差無失真響應 (MVDR [Capon, 1969]) 波束形成權重。 |
|
透過特徵值分解估計相對傳遞函式 (RTF) 或導向向量。 |
|
透過冪法估計相對傳遞函式 (RTF) 或導向向量。 |
|
將波束形成權重應用於多通道噪聲譜,以獲得單通道增強譜。 |
損失¶
計算來自 Sequence Transduction with Recurrent Neural Networks [Graves, 2012] 的 RNN Transducer 損失。 |
指標¶
計算兩個序列之間的詞級編輯(Levenshtein)距離。 |