VoxCeleb1Identification¶
- 類 torchaudio.datasets.VoxCeleb1Identification(root: Union[str, Path], subset: str = 'train', meta_url: str = 'https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/iden_split.txt', download: bool = False)[source]¶
VoxCeleb1 [Nagrani et al., 2017] 資料集,用於說話人識別任務。
每個資料樣本包含波形、取樣率、說話人 ID 和檔案 ID。
- 引數:
root (str or Path) – 資料集所在目錄或下載目錄的路徑。
subset (str, 可選) – 要使用的資料集子集。選項:[“train”, “dev”, “test”]。 (Default:
"train")meta_url (str, 可選) – 包含子集標籤和檔案路徑列表的元檔案的 URL。每行的格式為
subset file_path"。 例如: ``1 id10006/nLEBBc9oIFs/00003.wav。1,2,3分別表示train,dev, 和test子集。 (Default:"https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/iden_split.txt")download (bool, 可選) – 如果在 root 路徑下找不到資料集,是否下載資料集。(Default:
False)。
注意
VoxCeleb1Identification 資料集的檔案結構如下
└─ root/
└─ wav/
└─ speaker_id 資料夾
預先下載了
"vox1_dev_wav.zip"和"vox1_test_wav.zip"檔案的使用者需要將解壓後的檔案移動到同一個root目錄下。