TEDLIUM¶

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[source]¶

Tedlium [Rousseau et al., 2012] 資料集 (版本 1,2 和 3)。

引數：

root (str or Path) – 資料集所在或下載到的目錄路徑。
release (str, optional) – 版本號。允許的值為 "release1", "release2" 或 "release3"。（預設值："release1"）。
subset (str, optional) – 要使用的資料集子集。有效選項為 "train", "dev", 和 "test"。預設為 "train"。
download (bool, optional) – 如果在根路徑下找不到資料集是否下載。（預設值：False）。
audio_ext (str, optional) – 音訊副檔名（預設值：".sph"）

屬性¶

phoneme_dict¶

property TEDLIUM.phoneme_dict¶

音素。單詞到音素元組的對映。請注意，有些單詞沒有音素。

型別：: dict[str, tuple[str]]

方法¶

getitem¶

TEDLIUM.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶

從資料集中載入第 n 個樣本。

引數：

n (int) – 要載入的樣本索引

返回：

以下專案的元組；

Tensor: 波形
int: 取樣率
str: 文字記錄
int: 講話 ID
int: 說話者 ID
int: 識別符號

TEDLIUM¶

屬性¶

phoneme_dict¶

方法¶

getitem¶

文件

教程

資源

TEDLIUM¶

屬性¶

phoneme_dict¶

方法¶

__getitem__¶

文件

教程

資源

getitem¶