VoxCeleb1Verification¶

class torchaudio.datasets.VoxCeleb1Verification(root: Union[str, Path], meta_url: str = 'https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt', download: bool = False)[原始碼]¶

用於說話人驗證任務的 VoxCeleb1 [Nagrani 等, 2017] 資料集。

每個資料樣本包含一對波形、取樣率、指示它們是否來自同一說話人的標籤以及檔案 ID。

引數：

root (str 或 Path) – 資料集所在或下載到的目錄路徑。
meta_url (str, 可選) – 元檔案的 URL，該檔案包含一系列話語對和相應的標籤。每行的格式為 label file_path1 file_path2"。例如：``1 id10270/x6uYqmx31kE/00001.wav id10270/8jEAjG6SegY/00008.wav。 1 表示兩個話語來自同一說話人，0 表示不是。(預設值: "https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt")
download (bool, 可選) – 如果在 root 路徑下未找到資料集，是否下載資料集。(預設值: False)。

注意

VoxCeleb1Verification 資料集的目錄結構如下：

└─ root/

└─ wav/

└─ speaker_id folders

預先下載了 "vox1_dev_wav.zip" 和 "vox1_test_wav.zip" 檔案的使用者需要將解壓後的檔案移動到同一個 root 目錄下。

getitem¶

VoxCeleb1Verification.__getitem__(n: int) → Tuple[Tensor, Tensor, int, int, str, str][原始碼]¶

從資料集中載入第 n 個樣本。

引數：

n (int) – 要載入的樣本索引。

返回：

包含以下專案的元組：

Tensor: 說話人 1 的波形
Tensor: 說話人 2 的波形
int: 取樣率
int: 標籤
str: 說話人 1 的檔案 ID
str: 說話人 2 的檔案 ID

get_metadata¶

VoxCeleb1Verification.get_metadata(n: int) → Tuple[str, str, int, int, str, str][原始碼]¶

獲取資料集中第 n 個樣本的元資料。返回檔案路徑而不是波形，但其他方面返回與 __getitem__() 相同的欄位。

引數：

n (int) – 樣本的索引

返回：

包含以下專案的元組：

str: 說話人 1 音訊檔案路徑
str: 說話人 2 音訊檔案路徑
int: 取樣率
int: 標籤
str: 說話人 1 的檔案 ID
str: 說話人 2 的檔案 ID

VoxCeleb1Verification¶

getitem¶

get_metadata¶

文件

教程

資源

VoxCeleb1Verification¶

__getitem__¶

get_metadata¶

文件

教程

資源

getitem¶