torch.Storage¶

在 PyTorch 中，一個常規的 tensor 是一個多維陣列，由以下元件定義：

Storage：tensor 的實際資料，儲存為一個連續的一維位元組陣列。
dtype：tensor 中元素的資料型別，例如 torch.float32 或 torch.int64。
shape：一個元組，指示 tensor 在每個維度上的大小。
Stride：在每個維度上從一個元素移動到下一個元素所需的步長。
Offset：儲存中 tensor 資料開始的起始點。對於新建立的 tensor，這通常為 0。

這些元件共同定義了 tensor 的結構和資料，其中 storage 儲存實際資料，其餘部分作為元資料。

無型別 Storage API¶

torch.UntypedStorage 是一個連續的一維元素陣列。其長度等於 tensor 的位元組數。storage 作為 tensor 的底層資料容器。通常，在 PyTorch 中使用常規建構函式（如 zeros()、zeros_like() 或 new_zeros()）建立的 tensor，其 tensor storage 與 tensor 本身之間存在一對一的對應關係。

然而，一個 storage 可以被多個 tensor 共享。例如，tensor 的任何檢視（透過 view() 或某些（但非全部）索引型別（如整數和切片）獲得）將指向與原始 tensor 相同的底層 storage。序列化和反序列化共享同一 storage 的 tensor 時，這種關係得以保留，並且這些 tensor 繼續指向同一 storage。有趣的是，反序列化指向單個 storage 的多個 tensor 比反序列化多個獨立的 tensor 更快。

可以透過 untyped_storage() 方法訪問 tensor storage。這將返回型別為 torch.UntypedStorage 的物件。幸運的是，storage 有一個唯一的識別符號，透過 torch.UntypedStorage.data_ptr() 方法訪問。在常規設定中，具有相同資料 storage 的兩個 tensor 將具有相同的 storage data_ptr。然而，tensor 本身可以指向兩個獨立的 storage，一個用於其 資料 屬性，另一個用於其 梯度 屬性。每個都需要自己的 data_ptr()。通常，不能保證 torch.Tensor.data_ptr() 和 torch.UntypedStorage.data_ptr() 匹配，也不應假定如此。

無型別 storage 與基於它們的 tensor 有些獨立。實際上，這意味著具有不同 dtype 或 shape 的 tensor 可以指向同一個 storage。這也意味著 tensor storage 可以被更改，如下例所示：

>>> t = torch.ones(3)
>>> s0 = t.untyped_storage()
>>> s0
 0
 0
 128
 63
 0
 0
 128
 63
 0
 0
 128
 63
[torch.storage.UntypedStorage(device=cpu) of size 12]
>>> s1 = s0.clone()
>>> s1.fill_(0)
 0
 0
 0
 0
 0
 0
 0
 0
 0
 0
 0
 0
[torch.storage.UntypedStorage(device=cpu) of size 12]
>>> # Fill the tensor with a zeroed storage
>>> t.set_(s1, storage_offset=t.storage_offset(), stride=t.stride(), size=t.size())
tensor([0., 0., 0.])

警告

請注意，直接修改 tensor 的 storage（如本例所示）不是推薦的做法。這種低階操作僅出於教育目的進行演示，以展示 tensor 及其底層 storage 之間的關係。通常，使用標準的 torch.Tensor 方法（例如 clone() 和 fill_()）來實現相同結果更有效、更安全。

除了 data_ptr，無型別 storage 還有其他屬性，例如 filename（如果 storage 指向磁碟上的檔案）、device 或 is_cuda 用於裝置檢查。storage 還可以使用諸如 copy_、fill_ 或 pin_memory 之類的方法進行原地或非原地操作。有關更多資訊，請檢視下面的 API 參考。請記住，修改 storage 是一種低階 API，伴隨著風險！大多數這些 API 也存在於 tensor 級別：如果存在，應優先使用它們的 tensor 對應項。

特殊情況¶

我們提到，具有非 None 梯度 屬性的 tensor 實際上包含兩個資料塊。在這種情況下，untyped_storage() 將返回 資料 屬性的 storage，而梯度的 storage 可以透過 tensor.grad.untyped_storage() 獲取。

>>> t = torch.zeros(3, requires_grad=True)
>>> t.sum().backward()
>>> assert list(t.untyped_storage()) == [0] * 12  # the storage of the tensor is just 0s
>>> assert list(t.grad.untyped_storage()) != [0] * 12  # the storage of the gradient isn't

也存在 tensor 沒有典型 storage 或根本沒有 storage 的特殊情況：

"meta" 裝置上的 Tensor："meta" 裝置上的 tensor 用於 shape 推斷，不包含實際資料。
Fake Tensors：PyTorch 編譯器使用的另一個內部工具是 FakeTensor，它基於類似的想法。

Tensor 子類或類似 tensor 的物件也可能表現出異常行為。一般來說，我們不期望很多使用場景需要操作到 Storage 級別！

class torch.UntypedStorage(*args, **kwargs)[source][source]¶

bfloat16()[source]¶: 將此 storage 轉換為 bfloat16 型別。

bool()[source]¶: 將此 storage 轉換為 bool 型別。

byte()[source]¶: 將此 storage 轉換為 byte 型別。

byteswap(dtype)[source]¶: 交換底層資料中的位元組。

char()[source]¶: 將此 storage 轉換為 char 型別。

clone()[source]¶: 返回此 storage 的副本。

complex_double()[source]¶: 將此 storage 轉換為 complex double 型別。

complex_float()[source]¶: 將此 storage 轉換為 complex float 型別。

copy_()¶

cpu()[source]¶: 如果此 storage 不在 CPU 上，則返回其 CPU 副本。

cuda(device=None, non_blocking=False)[source]¶

返回此物件在 CUDA 記憶體中的副本。

如果此物件已在 CUDA 記憶體中且位於正確的裝置上，則不執行復制並返回原始物件。

引數

device (int) – 目標 GPU ID。預設為當前裝置。
non_blocking (bool) – 如果為 True 且源在 pinned memory 中，則複製相對於主機是非同步的。否則，該引數無效。

返回型別

Union[_StorageBase, TypedStorage]

data_ptr()¶

device: device¶

double()[source]¶: 將此 storage 轉換為 double 型別。

element_size()¶

property filename: Optional[str]¶

返回與此 storage 關聯的檔名。

如果 storage 在 CPU 上並透過 from_file() 設定 shared 為 True 建立，則檔名將是一個字串。否則，此屬性為 None。

fill_()¶

float()[source]¶: 將此 storage 轉換為 float 型別。

float8_e4m3fn()[source]¶: 將此 storage 轉換為 float8_e4m3fn 型別

float8_e4m3fnuz()[source]¶: 將此 storage 轉換為 float8_e4m3fnuz 型別

float8_e5m2()[source]¶: 將此 storage 轉換為 float8_e5m2 型別

float8_e5m2fnuz()[source]¶: 將此 storage 轉換為 float8_e5m2fnuz 型別

static from_buffer()¶

static from_file(filename, shared=False, size=0) → Storage¶

建立一個由記憶體對映檔案支援的 CPU storage。

如果 shared 為 True，則所有程序之間共享記憶體。所有更改都會寫入檔案。如果 shared 為 False，則 storage 上的更改不會影響檔案。

size 是 storage 中的元素數量。如果 shared 為 False，則檔案必須包含至少 size * sizeof(Type) 位元組（Type 是 storage 的型別，對於 UnTypedStorage，檔案必須包含至少 size 位元組）。如果 shared 為 True，如果需要將建立檔案。

引數

filename (str) – 要對映的檔名
shared (bool) – 是否共享記憶體（是傳遞 MAP_SHARED 還是 MAP_PRIVATE 給底層 mmap(2) 呼叫）
size (int) – storage 中的元素數量

get_device()[source]¶

返回型別: int

half()[source]¶: 將此 storage 轉換為 half 型別。

hpu(device=None, non_blocking=False)[source]¶

返回此物件在 HPU 記憶體中的副本。

如果此物件已在 HPU 記憶體中且位於正確的裝置上，則不執行復制並返回原始物件。

引數

device (int) – 目標 HPU ID。預設為當前裝置。
non_blocking (bool) – 如果為 True 且源在 pinned memory 中，則複製相對於主機是非同步的。否則，該引數無效。

返回型別

Union[_StorageBase, TypedStorage]

int()[source]¶: 將此 storage 轉換為 int 型別。

property is_cuda¶

property is_hpu¶

is_pinned(device='cuda')[source]¶

確定 CPU storage 是否已固定在裝置上。

引數: device (str 或 torch.device) – 要固定記憶體的裝置（預設值：'cuda'）。不建議使用此引數，它可能會被棄用。
返回: 一個布林變數。

is_shared()¶

is_sparse: bool = False¶

is_sparse_csr: bool = False¶

long()[source]¶: 轉換為 long 型別的儲存。

mps()[source]¶: 如果此儲存尚未位於 MPS 上，則返回此儲存的 MPS 副本。

nbytes()¶

new()¶

pin_memory(device='cuda')[source]¶

將 CPU 儲存複製到固定記憶體，如果尚未固定。

引數: device (str 或 torch.device) – 要固定記憶體的裝置（預設值：'cuda'）。不建議使用此引數，它可能會被棄用。
返回: 一個固定記憶體的 CPU 儲存。

resizable()¶

resize_()¶

share_memory_(*args, **kwargs)[source][source]¶

將儲存移動到共享記憶體。

對於已在共享記憶體中的儲存以及 CUDA 儲存（它們無需移動即可跨程序共享），這是一個空操作。共享記憶體中的儲存無法調整大小。

請注意，為緩解 this 等問題，在同一物件上從多個執行緒呼叫此函式是執行緒安全的。但是，在未進行適當同步的情況下，呼叫 self 上的任何其他函式都是非執行緒安全的。請參閱 Multiprocessing best practices 以獲取更多詳細資訊。

注意

當共享記憶體中儲存的所有引用都被刪除時，關聯的共享記憶體物件也將被刪除。PyTorch 有一個特殊的清理流程，以確保即使當前程序意外退出，此操作也會發生。

值得注意的是 share_memory_() 與 from_file() 並設定 shared = True 之間的區別。

share_memory_ 使用 shm_open(3) 建立一個 POSIX 共享記憶體物件，而 from_file() 使用 open(2) 開啟使用者傳入的檔名。
兩者都使用帶有 MAP_SHARED 的 mmap(2) 呼叫，將檔案/物件對映到當前的虛擬地址空間。
share_memory_ 會在對映物件後呼叫 shm_unlink(3)，以確保當沒有程序開啟該物件時，共享記憶體物件會被釋放。torch.from_file(shared=True) 不會取消連結該檔案。此檔案是持久的，將保留直到使用者刪除它。

返回: self

short()[source]¶: 轉換為 short 型別的儲存。

size()[source]¶

返回型別: int

to(*, device, non_blocking=False)[source]¶

tolist()[source]¶: 返回包含此儲存元素的列表。

type(dtype=None, non_blocking=False)[source]¶

返回型別: Union[_StorageBase, TypedStorage]

untyped()[source]¶

傳統型別儲存¶

警告

從歷史角度來看，PyTorch 以前使用型別化儲存類，這些類現已棄用，應避免使用。以下詳細介紹了此 API，以防您遇到它，但強烈不建議使用它。將來，除了 torch.UntypedStorage 之外的所有儲存類都將被移除，並且所有情況下都將使用 torch.UntypedStorage。

torch.Storage 是對應於預設資料型別 (torch.get_default_dtype()) 的儲存類的別名。例如，如果預設資料型別是 torch.float，則 torch.Storage 解析為 torch.FloatStorage。

torch.<type>Storage 和 torch.cuda.<type>Storage 類，例如 torch.FloatStorage、torch.IntStorage 等，實際上從未例項化。呼叫它們的建構函式會建立一個具有適當 torch.dtype 和 torch.device 的 torch.TypedStorage。torch.<type>Storage 類擁有 torch.TypedStorage 所擁有的所有相同的類方法。

一個 torch.TypedStorage 是一個連續的、一維的陣列，其中包含特定 torch.dtype 的元素。它可以指定任何 torch.dtype，內部資料將得到相應的解釋。torch.TypedStorage 包含一個 torch.UntypedStorage，它將資料儲存為無型別的位元組陣列。

每個跨步 torch.Tensor 都包含一個 torch.TypedStorage，它儲存 torch.Tensor 檢視的所有資料。

class torch.TypedStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

bfloat16()[source][source]¶: 將此 storage 轉換為 bfloat16 型別。

bool()[source][source]¶: 將此 storage 轉換為 bool 型別。

byte()[source][source]¶: 將此 storage 轉換為 byte 型別。

char()[source][source]¶: 將此 storage 轉換為 char 型別。

clone()[source][source]¶: 返回此 storage 的副本。

complex_double()[source][source]¶: 將此 storage 轉換為 complex double 型別。

complex_float()[source][source]¶: 將此 storage 轉換為 complex float 型別。

copy_(source, non_blocking=None)[source][source]¶

cpu()[source][source]¶: 如果此 storage 不在 CPU 上，則返回其 CPU 副本。

cuda(device=None, non_blocking=False)[source][source]¶

返回此物件在 CUDA 記憶體中的副本。

如果此物件已在 CUDA 記憶體中且位於正確的裝置上，則不執行復制並返回原始物件。

引數

device (int) – 目標 GPU ID。預設為當前裝置。
non_blocking (bool) – 如果為 True 且源在 pinned memory 中，則複製相對於主機是非同步的。否則，該引數無效。

返回型別

Self

data_ptr()[source][source]¶

property device¶

double()[source][source]¶: 將此 storage 轉換為 double 型別。

dtype: dtype¶

element_size()[source][source]¶

property filename: Optional[str]¶: 如果此儲存是從檔案記憶體對映建立的，則返回與其關聯的檔名；如果此儲存不是透過記憶體對映檔案建立的，則返回 None。

fill_(value)[source][source]¶

float()[source][source]¶: 將此 storage 轉換為 float 型別。

float8_e4m3fn()[source][source]¶: 將此 storage 轉換為 float8_e4m3fn 型別

float8_e4m3fnuz()[source][source]¶: 將此 storage 轉換為 float8_e4m3fnuz 型別

float8_e5m2()[source][source]¶: 將此 storage 轉換為 float8_e5m2 型別

float8_e5m2fnuz()[source][source]¶: 將此 storage 轉換為 float8_e5m2fnuz 型別

classmethod from_buffer(*args, **kwargs)[source][source]¶

classmethod from_file(filename, shared=False, size=0) → Storage[source][source]¶

建立一個由記憶體對映檔案支援的 CPU storage。

如果 shared 為 True，則所有程序之間共享記憶體。所有更改都會寫入檔案。如果 shared 為 False，則 storage 上的更改不會影響檔案。

size 是儲存中的元素數量。如果 shared 為 False，則檔案必須至少包含 size * sizeof(Type) 位元組（Type 是儲存的型別）。如果 shared 為 True，則會在需要時建立檔案。

引數

filename (str) – 要對映的檔名
shared (bool) –
是否共享記憶體（是否將 MAP_SHARED 或 MAP_PRIVATE 傳遞到底層 mmap(2) 呼叫）
size (int) – storage 中的元素數量

get_device()[source][source]¶

返回型別: int

half()[source][source]¶: 將此 storage 轉換為 half 型別。

hpu(device=None, non_blocking=False)[source][source]¶

返回此物件在 HPU 記憶體中的副本。

如果此物件已在 HPU 記憶體中且位於正確的裝置上，則不執行復制並返回原始物件。

引數

device (int) – 目標 HPU ID。預設為當前裝置。
non_blocking (bool) – 如果為 True 且源在 pinned memory 中，則複製相對於主機是非同步的。否則，該引數無效。

返回型別

Self

int()[source][source]¶: 將此 storage 轉換為 int 型別。

property is_cuda¶

property is_hpu¶

is_pinned(device='cuda')[source][source]¶

確定 CPU TypedStorage 是否已固定在裝置上。

引數: device (str 或 torch.device) – 要固定記憶體的裝置（預設值：'cuda'）。不建議使用此引數，它可能會被棄用。
返回: 一個布林變數。

is_shared()[source][source]¶

is_sparse: bool = False¶

long()[source][source]¶: 轉換為 long 型別的儲存。

nbytes()[source][source]¶

pickle_storage_type()[source][source]¶

pin_memory(device='cuda')[source][source]¶

將 CPU TypedStorage 複製到鎖頁記憶體（如果尚未鎖定）。

引數: device (str 或 torch.device) – 要固定記憶體的裝置（預設值：'cuda'）。不建議使用此引數，它可能會被棄用。
返回: 一個固定記憶體的 CPU 儲存。

resizable()[source][source]¶

resize_(size)[source][source]¶

share_memory_()[source][source]¶: 參見 torch.UntypedStorage.share_memory_()

short()[source][source]¶: 轉換為 short 型別的儲存。

size()[source][source]¶

to(*, device, non_blocking=False)[source][source]¶

返回此物件在裝置記憶體中的副本。

如果此物件已在正確的裝置上，則不執行復制，而是返回原始物件。

引數

device (int) – 目標裝置。
non_blocking (bool) – 如果為 True 且源在 pinned memory 中，則複製相對於主機是非同步的。否則，該引數無效。

返回型別

Self

tolist()[source][source]¶: 返回包含此儲存元素的列表。

type(dtype=None, non_blocking=False)[source][source]¶

如果未提供 dtype，則返回型別，否則將此物件強制轉換為指定的型別。

如果此物件已經是正確的型別，則不執行復制，而是返回原始物件。

引數

dtype (type or 字串) – 所需的型別
non_blocking (bool) – 如果為 True，且源位於鎖頁記憶體中而目標位於 GPU 上，或反之，則相對於主機非同步執行復制。否則，此引數無效。
**kwargs – 為了相容性，可能包含鍵 async 以代替 non_blocking 引數。 async 引數已棄用。

返回型別

Union[_StorageBase, TypedStorage, str]

untyped()[source][source]¶: 返回內部的 torch.UntypedStorage。

class torch.DoubleStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.float64[source]¶

class torch.FloatStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.float32[source]¶

class torch.HalfStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.float16[source]¶

class torch.LongStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.int64[source]¶

class torch.IntStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.int32[source]¶

class torch.ShortStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.int16[source]¶

class torch.CharStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.int8[source]¶

class torch.ByteStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.uint8[source]¶

class torch.BoolStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.bool[source]¶

class torch.BFloat16Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.bfloat16[source]¶

class torch.ComplexDoubleStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.complex128[source]¶

class torch.ComplexFloatStorage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.complex64[source]¶

class torch.QUInt8Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.quint8[source]¶

class torch.QInt8Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.qint8[source]¶

class torch.QInt32Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[source][source]¶

dtype: torch.dtype = torch.qint32[source]¶

class torch.QUInt4x2Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[源][源]¶

dtype: torch.dtype = torch.quint4x2[源]¶

class torch.QUInt2x4Storage(*args, wrap_storage=None, dtype=None, device=None, _internal=False)[源][源]¶

dtype: torch.dtype = torch.quint2x4[源]¶

torch.Storage¶

無型別 Storage API¶

特殊情況¶

傳統型別儲存¶

文件

教程

資源