torchaudio.datasets¶
所有資料集都是 torch.utils.data.Dataset 的子類,並實現了 __getitem__ 和 __len__ 方法。
因此,它們都可以傳遞給 torch.utils.data.DataLoader,後者可以使用 torch.multiprocessing worker 並行載入多個樣本。例如
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
CMU ARCTIC [Kominek 等, 2003] 資料集。 |
|
CMU Pronouncing Dictionary [Weide, 1998] (CMUDict) 資料集。 |
|
CommonVoice [Ardila 等, 2020] 資料集。 |
|
Device Recorded VCTK (Small subset version) [Sarfjoo 和 Yamagishi, 2018] 資料集。 |
|
Fluent Speech Commands [Lugosch 等, 2019] 資料集 |
|
GTZAN [Tzanetakis 等, 2001] 資料集。 |
|
IEMOCAP [Busso 等, 2008] 資料集。 |
|
LibriMix [Cosentino 等, 2020] 資料集。 |
|
LibriSpeech [Panayotov 等, 2015] 資料集。 |
|
Libri-light [Kahn 等, 2020] 資料集的子集,該子集在 HuBERT [Hsu 等, 2021] 中用於監督微調。 |
|
LibriTTS [Zen 等, 2019] 資料集。 |
|
LJSpeech-1.1 [Ito 和 Johnson, 2017] 資料集。 |
|
MUSDB_HQ [Rafii 等, 2019] 資料集。 |
|
QUESST14 [Miro 等, 2015] 資料集。 |
|
Snips [Coucke 等, 2018] 資料集。 |
|
Speech Commands [Warden, 2018] 資料集。 |
|
Tedlium [Rousseau 等, 2012] 資料集 (releases 1,2 and 3)。 |
|
VCTK 0.92 [Yamagishi 等, 2019] 資料集 |
|
VoxCeleb1 [Nagrani 等, 2017] 資料集,用於說話人識別任務。 |
|
VoxCeleb1 [Nagrani 等, 2017] 資料集,用於說話人驗證任務。 |
|
YesNo [YesNo, n.d.] 資料集。 |