快捷方式

VCTK_092

class torchaudio.datasets.VCTK_092(root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[原始碼]

VCTK 0.92 [Yamagishi 等人,2019] 資料集

引數:
  • root (str) – 資料集頂級目錄所在的根目錄。

  • mic_id (str, 可選) – 麥克風 ID。可以是 "mic1""mic2"。(預設值:"mic2"

  • download (bool, 可選) – 如果在根路徑未找到資料集,是否下載。 (預設值:False)。

  • url (str, 可選) – 資料集的下載 URL。(預設值:"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip"

  • audio_ext (str, 可選) – 如果資料集轉換為非預設音訊格式,則為自定義音訊副檔名。

注意

  • 來自說話人 p315 的所有語音都將被跳過,因為缺少對應的文字檔案。

  • 來自說話人 p280 的所有語音對於 mic_id="mic2" 都將被跳過,因為缺少音訊檔案。

  • 來自說話人 p362 的部分語音將因缺少音訊檔案而被跳過。

  • 另請參閱:https://datashare.is.ed.ac.uk/handle/10283/3443

__getitem__

VCTK_092.__getitem__(n: int) Tuple[Tensor, int, str, str, str][原始碼]

從資料集中載入第 n 個樣本。

引數:

n (int) – 要載入樣本的索引

返回值:

包含以下項的元組;

Tensor

波形

int

取樣率

str

轉錄文字

str

說話人 ID

str

話語 ID

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源