快捷方式

LibriMix

class torchaudio.datasets.LibriMix(root: Union[str, Path], subset: str = 'train-360', num_speakers: int = 2, sample_rate: int = 8000, task: str = 'sep_clean', mode: str = 'min')[原始碼]

LibriMix [Cosentino 等人,2020] 資料集。

引數:
  • root (strPath) – `Libri2Mix` 或 `Libri3Mix` 目錄所在的路徑。不是這些目錄本身的路徑。

  • subset (str,可選) – 要使用的子集。選項:[`"train-360"`、`"train-100"`、`"dev"` 和 `"test"`] (預設值:`"train-360"`)。

  • num_speakers (int,可選) – 說話人的數量,這將決定要遍歷的目錄。資料集將遍歷 `s1` 到 `sN` 目錄以收集 N 個源音訊。(預設值:2)

  • sample_rate (int,可選) – 音訊檔案的取樣率。`sample_rate` 決定從哪個子目錄獲取音訊。如果任何音訊具有不同的取樣率,則會引發 `ValueError`。選項:[8000, 16000] (預設值:8000)

  • task (str,可選) – LibriMix 的任務。選項:[`"enh_single"`、`"enh_both"`、`"sep_clean"`、`"sep_noisy"`] (預設值:`"sep_clean"`)

  • mode (str,可選) – 建立混合時的模式。如果設定為 `"min"`,則混合和源的長度是所有源中的最短長度。如果設定為 `"max"`,則混合和源的長度將零填充到所有源中最長長度。選項:[`"min"`、`"max"`] (預設值:`"min"`)

注意

LibriMix 資料集需要手動生成。請檢視 https://github.com/JorisCos/LibriMix

__getitem__

LibriMix.__getitem__(key: int) Tuple[int, Tensor, List[Tensor]][原始碼]

載入資料集中的第 n 個樣本。

引數:

key (int) – 要載入的樣本索引

返回:

包含以下元素的元組;

int

取樣率

Tensor

混合波形

Tensor 列表

源波形列表

get_metadata

LibriMix.get_metadata(key: int) Tuple[int, str, List[str]][原始碼]

獲取資料集中第 n 個樣本的元資料。

引數:

key (int) – 要載入的樣本索引

返回:

包含以下元素的元組;

int

取樣率

str

混合音訊路徑

str 列表

源音訊路徑列表

文件

查閱 PyTorch 的全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲得答疑

檢視資源