LibriMix¶

class torchaudio.datasets.LibriMix(root: Union[str, Path], subset: str = 'train-360', num_speakers: int = 2, sample_rate: int = 8000, task: str = 'sep_clean', mode: str = 'min')[原始碼]¶

LibriMix [Cosentino 等人，2020] 資料集。

引數：

root (str 或 Path) – `Libri2Mix` 或 `Libri3Mix` 目錄所在的路徑。不是這些目錄本身的路徑。
subset (str，可選) – 要使用的子集。選項：[`"train-360"`、`"train-100"`、`"dev"` 和 `"test"`] (預設值：`"train-360"`)。
num_speakers (int，可選) – 說話人的數量，這將決定要遍歷的目錄。資料集將遍歷 `s1` 到 `sN` 目錄以收集 N 個源音訊。(預設值：2)
sample_rate (int，可選) – 音訊檔案的取樣率。`sample_rate` 決定從哪個子目錄獲取音訊。如果任何音訊具有不同的取樣率，則會引發 `ValueError`。選項：[8000, 16000] (預設值：8000)
task (str，可選) – LibriMix 的任務。選項：[`"enh_single"`、`"enh_both"`、`"sep_clean"`、`"sep_noisy"`] (預設值：`"sep_clean"`)
mode (str，可選) – 建立混合時的模式。如果設定為 `"min"`，則混合和源的長度是所有源中的最短長度。如果設定為 `"max"`，則混合和源的長度將零填充到所有源中最長長度。選項：[`"min"`、`"max"`] (預設值：`"min"`)

注意

LibriMix 資料集需要手動生成。請檢視 https://github.com/JorisCos/LibriMix

getitem¶

LibriMix.__getitem__(key: int) → Tuple[int, Tensor, List[Tensor]][原始碼]¶

載入資料集中的第 n 個樣本。

引數：

key (int) – 要載入的樣本索引

返回：

包含以下元素的元組；

int: 取樣率
Tensor: 混合波形
Tensor 列表: 源波形列表

get_metadata¶

LibriMix.get_metadata(key: int) → Tuple[int, str, List[str]][原始碼]¶

獲取資料集中第 n 個樣本的元資料。

引數：

key (int) – 要載入的樣本索引

返回：

包含以下元素的元組；

int: 取樣率
str: 混合音訊路徑
str 列表: 源音訊路徑列表

LibriMix¶

getitem¶

get_metadata¶

文件

教程

資源

LibriMix¶

__getitem__¶

get_metadata¶

文件

教程

資源

getitem¶