VCTK_092¶

class torchaudio.datasets.VCTK_092(root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[原始碼]¶

VCTK 0.92 [Yamagishi 等人，2019] 資料集

引數：

root (str) – 資料集頂級目錄所在的根目錄。
mic_id (str, 可選) – 麥克風 ID。可以是 "mic1" 或 "mic2"。（預設值："mic2"）
download (bool, 可選) – 如果在根路徑未找到資料集，是否下載。（預設值：False）。
url (str, 可選) – 資料集的下載 URL。（預設值："https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"）
audio_ext (str, 可選) – 如果資料集轉換為非預設音訊格式，則為自定義音訊副檔名。

注意

來自說話人 p315 的所有語音都將被跳過，因為缺少對應的文字檔案。
來自說話人 p280 的所有語音對於 mic_id="mic2" 都將被跳過，因為缺少音訊檔案。
來自說話人 p362 的部分語音將因缺少音訊檔案而被跳過。
另請參閱：https://datashare.is.ed.ac.uk/handle/10283/3443

getitem¶

VCTK_092.__getitem__(n: int) → Tuple[Tensor, int, str, str, str][原始碼]¶

從資料集中載入第 n 個樣本。

引數：

n (int) – 要載入樣本的索引

返回值：

包含以下項的元組；

Tensor: 波形
int: 取樣率
str: 轉錄文字
str: 說話人 ID
str: 話語 ID

VCTK_092¶

getitem¶

文件

教程

資源

VCTK_092¶

__getitem__¶

文件

教程

資源

getitem¶