快捷方式

torch.svd

torch.svd(input, some=True, compute_uv=True, *, out=None)

計算矩陣或一批矩陣 input 的奇異值分解。奇異值分解表示為命名元組 (U, S, V),使得 input =Udiag(S)VH= U \text{diag}(S) V^{\text{H}}。其中 VHV^{\text{H}} 對於實數輸入是 V 的轉置,對於複數輸入是 V 的共軛轉置。如果 input 是一批矩陣,則 USV 也具有與 input 相同的批次維度。

如果 someTrue(預設值),該方法返回縮減奇異值分解。在這種情況下,如果 input 的最後兩個維度是 mn,則返回的 UV 矩陣將只包含 min(n, m) 個標準正交列。

如果 compute_uvFalse,則返回的 UV 將是形狀分別為 (m, m)(n, n) 的零填充矩陣,並且與 input 在同一裝置上。當 compute_uvFalse 時,引數 some 無效。

支援 float、double、cfloat 和 cdouble 資料型別的 inputUV 的資料型別與 input 相同。即使 input 是複數,S 也將始終是實數值。

警告

torch.svd() 已棄用,請使用 torch.linalg.svd(),並將在未來的 PyTorch 版本中移除。

U, S, V = torch.svd(A, some=some, compute_uv=True)(預設值)應替換為

U, S, Vh = torch.linalg.svd(A, full_matrices=not some)
V = Vh.mH

_, S, _ = torch.svd(A, some=some, compute_uv=False) 應替換為

S = torch.linalg.svdvals(A)

注意

torch.linalg.svd() 的區別

注意

奇異值按降序返回。如果 input 是一批矩陣,則批處理中每個矩陣的奇異值都按降序返回。

注意

只有當 compute_uvTrue 時,S 張量才能用於計算梯度。

注意

someFalse 時,反向傳播過程中將忽略 U[…, :, min(m, n):]V[…, :, min(m, n):] 上的梯度,因為這些向量可以是相應子空間的任意基。

注意

torch.linalg.svd() 在 CPU 上的實現使用 LAPACK 的例程 ?gesdd(分治演算法)而不是 ?gesvd 以提高速度。類似地,在 GPU 上,CUDA 10.1.243 及更高版本使用 cuSOLVER 的例程 gesvdjgesvdjBatched,早期版本的 CUDA 使用 MAGMA 的例程 gesdd

注意

返回的 U 將不是連續的。矩陣(或一批矩陣)將表示為列主序矩陣(即 Fortran 連續)。

警告

只有當輸入沒有零奇異值或重複奇異值時,對 UV 的梯度才是有限的。

警告

如果任意兩個奇異值之間的距離接近於零,則對 UV 的梯度將是數值不穩定的,因為它們取決於 1minijσi2σj2\frac{1}{\min_{i \neq j} \sigma_i^2 - \sigma_j^2}。當矩陣具有小奇異值時也會發生同樣的情況,因為這些梯度也取決於 S^{-1}

警告

對於複數值 input,奇異值分解不是唯一的,因為 UV 的每一列都可以乘以任意相位因子 eiϕe^{i \phi}。當 input 具有重複奇異值時也會發生同樣的情況,此時可以將 UV 中張成子空間的列乘以一個旋轉矩陣,結果向量將張成相同的子空間。不同的平臺(例如 NumPy)或不同裝置型別的輸入可能會產生不同的 UV 張量。

引數
  • input (Tensor) – 輸入張量,大小為 (*, m, n),其中 * 表示零個或多個批次維度,包含 (m, n) 矩陣。

  • some (bool, 可選) – 控制是計算縮減分解還是完全分解,進而影響返回的 UV 的形狀。預設值:True

  • compute_uv (bool, 可選) – 控制是否計算 UV。預設值:True

關鍵字引數

out (tuple, 可選) – 輸出張量元組

示例

>>> a = torch.randn(5, 3)
>>> a
tensor([[ 0.2364, -0.7752,  0.6372],
        [ 1.7201,  0.7394, -0.0504],
        [-0.3371, -1.0584,  0.5296],
        [ 0.3550, -0.4022,  1.5569],
        [ 0.2445, -0.0158,  1.1414]])
>>> u, s, v = torch.svd(a)
>>> u
tensor([[ 0.4027,  0.0287,  0.5434],
        [-0.1946,  0.8833,  0.3679],
        [ 0.4296, -0.2890,  0.5261],
        [ 0.6604,  0.2717, -0.2618],
        [ 0.4234,  0.2481, -0.4733]])
>>> s
tensor([2.3289, 2.0315, 0.7806])
>>> v
tensor([[-0.0199,  0.8766,  0.4809],
        [-0.5080,  0.4054, -0.7600],
        [ 0.8611,  0.2594, -0.4373]])
>>> torch.dist(a, torch.mm(torch.mm(u, torch.diag(s)), v.t()))
tensor(8.6531e-07)
>>> a_big = torch.randn(7, 5, 3)
>>> u, s, v = torch.svd(a_big)
>>> torch.dist(a_big, torch.matmul(torch.matmul(u, torch.diag_embed(s)), v.mT))
tensor(2.6503e-06)

文件

訪問 PyTorch 全面開發者文件

檢視文件

教程

獲取面向初學者和高階開發者的深度教程

檢視教程

資源

查詢開發資源並獲取問題解答

檢視資源