快捷方式

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[source]

Wav2Letter 模型架構,源自 Wav2Letter: 一個端到端基於 ConvNet 的語音識別系統 [Collobert 等人, 2016]

另請參閱

引數:
  • num_classes (int, 可選) – 需要分類的類別數量。(預設值: 40)

  • input_type (str, 可選) – Wav2Letter 可以使用的輸入型別:waveformpower_spectrummfcc。(預設值: waveform)。

  • num_features (int, 可選) – 網路將接收的輸入特徵數量。(預設值: 1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[source]
引數:

x (torch.Tensor) – 維度為 (batch_size, num_features, input_length) 的張量。

返回值:

預測器張量,維度為 (batch_size, number_of_classes, input_length)。

返回值型別:

Tensor

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲取問題解答

檢視資源