torchaudio.functional.amplitude_to_DB¶
- torchaudio.functional.amplitude_to_DB(x: Tensor, multiplier: float, amin: float, db_multiplier: float, top_db: Optional[float] = None) Tensor[source]¶
將頻譜圖從功率/幅度(amplitude)標度轉換為分貝(decibel)標度。
批處理中每個張量的輸出取決於該張量的最大值,因此對於分割成片段的音訊剪輯與完整的剪輯,可能會返回不同的值。
- 引數:
x (Tensor) –
轉換為分貝標度之前的輸入頻譜圖。預期的形狀是
(freq, time),(channel, freq, time)或(..., batch, channel, freq, time)。注意
當指定
top_db時,將為批處理中的每個音訊計算截止值。因此,如果輸入形狀是 4D(或更大),則批處理中的音訊資料將使用不同的截止值。如果輸入形狀是 2D 或 3D,則使用單個截止值。multiplier (float) – 功率(power)使用 10.,幅度(amplitude)使用 20.
amin (float) – 用於限制
x的數字db_multiplier (float) – Log10(max(參考值和 amin))
top_db (float 或 None, 可選) – 最小負截止分貝值。一個合理的數字是 80. (預設:
None)
- 返回:
分貝標度下的輸出張量
- 返回型別:
Tensor