LibriMix¶
- class torchaudio.datasets.LibriMix(root: Union[str, Path], subset: str = 'train-360', num_speakers: int = 2, sample_rate: int = 8000, task: str = 'sep_clean', mode: str = 'min')[原始碼]¶
LibriMix [Cosentino 等人,2020] 資料集。
- 引數:
root (str 或 Path) – `Libri2Mix` 或 `Libri3Mix` 目錄所在的路徑。不是這些目錄本身的路徑。
subset (str,可選) – 要使用的子集。選項:[`"train-360"`、`"train-100"`、`"dev"` 和 `"test"`] (預設值:`"train-360"`)。
num_speakers (int,可選) – 說話人的數量,這將決定要遍歷的目錄。資料集將遍歷 `s1` 到 `sN` 目錄以收集 N 個源音訊。(預設值:2)
sample_rate (int,可選) – 音訊檔案的取樣率。`sample_rate` 決定從哪個子目錄獲取音訊。如果任何音訊具有不同的取樣率,則會引發 `ValueError`。選項:[8000, 16000] (預設值:8000)
task (str,可選) – LibriMix 的任務。選項:[`"enh_single"`、`"enh_both"`、`"sep_clean"`、`"sep_noisy"`] (預設值:`"sep_clean"`)
mode (str,可選) – 建立混合時的模式。如果設定為 `"min"`,則混合和源的長度是所有源中的最短長度。如果設定為 `"max"`,則混合和源的長度將零填充到所有源中最長長度。選項:[`"min"`、`"max"`] (預設值:`"min"`)
注意
LibriMix 資料集需要手動生成。請檢視 https://github.com/JorisCos/LibriMix