VCTK_092¶
- class torchaudio.datasets.VCTK_092(root: str, mic_id: str = 'mic2', download: bool = False, url: str = 'https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip', audio_ext='.flac')[原始碼]¶
VCTK 0.92 [Yamagishi 等人,2019] 資料集
- 引數:
root (str) – 資料集頂級目錄所在的根目錄。
mic_id (str, 可選) – 麥克風 ID。可以是
"mic1"或"mic2"。(預設值:"mic2")download (bool, 可選) – 如果在根路徑未找到資料集,是否下載。 (預設值:
False)。url (str, 可選) – 資料集的下載 URL。(預設值:
"https://datashare.is.ed.ac.uk/bitstream/handle/10283/3443/VCTK-Corpus-0.92.zip")audio_ext (str, 可選) – 如果資料集轉換為非預設音訊格式,則為自定義音訊副檔名。
注意
來自說話人
p315的所有語音都將被跳過,因為缺少對應的文字檔案。來自說話人
p280的所有語音對於mic_id="mic2"都將被跳過,因為缺少音訊檔案。來自說話人
p362的部分語音將因缺少音訊檔案而被跳過。