快捷方式

TEDLIUM

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]

Tedlium [Rousseau et al., 2012] 資料集 (版本 1,2 和 3)。

引數:
  • root (str or Path) – 資料集所在或下載到的目錄路徑。

  • release (str, optional) – 版本號。允許的值為 "release1", "release2""release3"。(預設值:"release1")。

  • subset (str, optional) – 要使用的資料集子集。有效選項為 "train", "dev", 和 "test"。預設為 "train"

  • download (bool, optional) – 如果在根路徑下找不到資料集是否下載。(預設值:False)。

  • audio_ext (str, optional) – 音訊副檔名(預設值:".sph"

屬性

phoneme_dict

property TEDLIUM.phoneme_dict

音素。單詞到音素元組的對映。請注意,有些單詞沒有音素。

型別:

dict[str, tuple[str]]

方法

__getitem__

TEDLIUM.__getitem__(n: int) Tuple[Tensor, int, str, int, int, int][source]

從資料集中載入第 n 個樣本。

引數:

n (int) – 要載入的樣本索引

返回:

以下專案的元組;

Tensor

波形

int

取樣率

str

文字記錄

int

講話 ID

int

說話者 ID

int

識別符號

文件

訪問 PyTorch 的完整開發者文件

檢視文件

教程

獲取針對初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得解答

檢視資源