快捷方式

VoxCeleb1Verification

class torchaudio.datasets.VoxCeleb1Verification(root: Union[str, Path], meta_url: str = 'https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt', download: bool = False)[原始碼]

用於說話人驗證任務的 VoxCeleb1 [Nagrani , 2017] 資料集。

每個資料樣本包含一對波形、取樣率、指示它們是否來自同一說話人的標籤以及檔案 ID。

引數
  • root (strPath) – 資料集所在或下載到的目錄路徑。

  • meta_url (str, 可選) – 元檔案的 URL,該檔案包含一系列話語對和相應的標籤。每行的格式為 label file_path1 file_path2"。例如:``1 id10270/x6uYqmx31kE/00001.wav id10270/8jEAjG6SegY/00008.wav1 表示兩個話語來自同一說話人,0 表示不是。(預設值: "https://www.robots.ox.ac.uk/~vgg/data/voxceleb/meta/veri_test.txt")

  • download (bool, 可選) – 如果在 root 路徑下未找到資料集,是否下載資料集。(預設值: False)。

注意

VoxCeleb1Verification 資料集的目錄結構如下:

└─ root/

└─ wav/

└─ speaker_id folders

預先下載了 "vox1_dev_wav.zip""vox1_test_wav.zip" 檔案的使用者需要將解壓後的檔案移動到同一個 root 目錄下。

__getitem__

VoxCeleb1Verification.__getitem__(n: int) Tuple[Tensor, Tensor, int, int, str, str][原始碼]

從資料集中載入第 n 個樣本。

引數

n (int) – 要載入的樣本索引。

返回

包含以下專案的元組:

Tensor

說話人 1 的波形

Tensor

說話人 2 的波形

int

取樣率

int

標籤

str

說話人 1 的檔案 ID

str

說話人 2 的檔案 ID

get_metadata

VoxCeleb1Verification.get_metadata(n: int) Tuple[str, str, int, int, str, str][原始碼]

獲取資料集中第 n 個樣本的元資料。返回檔案路徑而不是波形,但其他方面返回與 __getitem__() 相同的欄位。

引數

n (int) – 樣本的索引

返回

包含以下專案的元組:

str

說話人 1 音訊檔案路徑

str

說話人 2 音訊檔案路徑

int

取樣率

int

標籤

str

說話人 1 的檔案 ID

str

說話人 2 的檔案 ID

文件

訪問 PyTorch 的綜合開發者文件

檢視文件

教程

獲取適合初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得問題解答

檢視資源