• 文件 >
  • torchaudio.datasets >
  • 舊版本 (stable)
快捷方式

torchaudio.datasets

所有資料集都是 torch.utils.data.Dataset 的子類,並實現了 __getitem____len__ 方法。

因此,它們都可以傳遞給 torch.utils.data.DataLoader,後者可以使用 torch.multiprocessing worker 並行載入多個樣本。例如

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

CMUARCTIC

CMU ARCTIC [Kominek , 2003] 資料集。

CMUDict

CMU Pronouncing Dictionary [Weide, 1998] (CMUDict) 資料集。

COMMONVOICE

CommonVoice [Ardila , 2020] 資料集。

DR_VCTK

Device Recorded VCTK (Small subset version) [Sarfjoo 和 Yamagishi, 2018] 資料集。

FluentSpeechCommands

Fluent Speech Commands [Lugosch , 2019] 資料集

GTZAN

GTZAN [Tzanetakis , 2001] 資料集。

IEMOCAP

IEMOCAP [Busso , 2008] 資料集。

LibriMix

LibriMix [Cosentino , 2020] 資料集。

LIBRISPEECH

LibriSpeech [Panayotov , 2015] 資料集。

LibriLightLimited

Libri-light [Kahn , 2020] 資料集的子集,該子集在 HuBERT [Hsu , 2021] 中用於監督微調。

LIBRITTS

LibriTTS [Zen , 2019] 資料集。

LJSPEECH

LJSpeech-1.1 [Ito 和 Johnson, 2017] 資料集。

MUSDB_HQ

MUSDB_HQ [Rafii , 2019] 資料集。

QUESST14

QUESST14 [Miro , 2015] 資料集。

Snips

Snips [Coucke , 2018] 資料集。

SPEECHCOMMANDS

Speech Commands [Warden, 2018] 資料集。

TEDLIUM

Tedlium [Rousseau , 2012] 資料集 (releases 1,2 and 3)。

VCTK_092

VCTK 0.92 [Yamagishi , 2019] 資料集

VoxCeleb1Identification

VoxCeleb1 [Nagrani , 2017] 資料集,用於說話人識別任務。

VoxCeleb1Verification

VoxCeleb1 [Nagrani , 2017] 資料集,用於說話人驗證任務。

YESNO

YesNo [YesNo, n.d.] 資料集。

文件

獲取 PyTorch 的完整開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深入教程

檢視教程

資源

查詢開發資源並獲取問題解答

檢視資源