PyTorch 实战指南：深入理解 Squeeze 与 Unsqueeze 操作

2026-02-05 11:20:20 0条评论 3次阅读 0人点赞

在深度学习的日常实践中，张量的形状决定了数据如何在神经网络中流动。你是否曾经遇到过维度不匹配的报错？或者疑惑为什么有时候一个维度是 1，有时候又消失了？在这篇文章中，我们将深入探讨 PyTorch 中处理张量维度的两个关键操作：Squeeze（压缩）和 Unsqueeze（解压/扩张）。掌握这两个工具，你将能游刃有余地处理图像数据、批次数据以及各种复杂的张量运算。

我们将通过实际代码示例，带你了解它们的工作原理、细微差别以及在真实场景中的应用。

1 什么是 Squeeze（压缩）？
2 什么是 Unsqueeze（解压/扩张）？
3 常见陷阱与最佳实践
4 总结

什么是 Squeeze（压缩）？

简单来说，INLINECODE6a8336c9 就像是一个“垃圾回收器”，专门用来清理张量中那些大小为 1 的维度。在 PyTorch 中，我们可以通过 INLINECODE1e0a2066 方法来实现这一点。

为什么需要 Squeeze？

想象一下，你处理了一批单通道的灰度图像。原本这批图像的维度应该是 INLINECODEbc8b75ce（例如 INLINECODEd61086bd），但有时由于某些操作（如读取数据集的格式），它会多出一个多余的通道维度，变成了 INLINECODEc04a8fc3。这个多余的 “1” 并不包含额外的信息，却会导致后续计算时的维度不匹配。这时，我们就需要 INLINECODEfe0c6b19 来移除它。

语法与参数

> 语法： torch.squeeze(input, dim=None, *, out=None)

核心参数解析：

input (Tensor): 我们想要处理的源张量。
dim (int, optional): 这是一个非常有用的参数。如果我们指定了 INLINECODEfc5ff1d9，操作将仅检查该维度。只有当该维度的大小恰好为 1 时，它才会被移除。如果不指定 INLINECODEe6e9bbbb，PyTorch 会遍历所有维度，并移除所有大小为 1 的维度。

示例 1：基础的全局压缩

让我们从最基础的情况开始。假设我们有一个形状奇怪的 5D 张量，其中包含几个大小为 1 的维度。

# 导入 PyTorch 库
import torch

# 定义一个输入张量，形状为 (3, 1, 2, 1, 4)
# 注意：第 1 维和第 3 维的大小为 1
input_tensor = torch.randn(3, 1, 2, 1, 4)

print(f"原始张量的形状: {input_tensor.size()}")

# 使用 squeeze() 移除所有大小为 1 的维度
squeezed_tensor = torch.squeeze(input_tensor)

print(f"Squeeze 后的形状: {squeezed_tensor.size()}")

输出结果：

原始张量的形状: torch.Size([3, 1, 2, 1, 4])
Squeeze 后的形状: torch.Size([3, 2, 4])

发生了什么？

你可以看到，原始形状中的 INLINECODE440bbce4（索引 1）和 INLINECODE5bf84932（索引 3）都被移除了。数据的总元素数量保持不变，原本排列在 INLINECODE2137dfb1 中的数据被重新排列到了 INLINECODE8e7ca241 的结构中。

示例 2：精准控制——在指定维度上压缩

有时候我们不想移除所有为 1 的维度，只想操作特定的那一个。这时就必须使用 dim 参数。让我们看看在不同维度上操作会发生什么。

import torch

# 创建一个输入张量
input_tensor = torch.randn(3, 1, 2, 1, 4)
print(f"-- 输入张量形状: {input_tensor.size()} --
")

# 情况 A：尝试压缩第 0 维（大小为 3，不是 1）
out = torch.squeeze(input_tensor, dim=0)
print(f"在 dim=0 压缩后: {out.size()} (无变化，因为该维不为1)")

# 情况 B：尝试压缩第 1 维（大小为 1）
out = torch.squeeze(input_tensor, dim=1)
print(f"在 dim=1 压缩后: {out.size()} (维度被移除!)")

# 情况 C：尝试压缩第 2 维（大小为 2，不是 1）
out = torch.squeeze(input_tensor, dim=2)
print(f"在 dim=2 压缩后: {out.size()} (无变化，因为该维不为1)")

输出结果：

-- 输入张量形状: torch.Size([3, 1, 2, 1, 4]) --

在 dim=0 压缩后: torch.Size([3, 1, 2, 1, 4]) (无变化，因为该维不为1)
在 dim=1 压缩后: torch.Size([3, 2, 1, 4]) (维度被移除!)
在 dim=2 压缩后: torch.Size([3, 1, 2, 1, 4]) (无变化，因为该维不为1)

实战经验： 在处理数据加载器的输出时，我们经常遇到多余的批次维度或通道维度。使用 INLINECODE3228f48d 参数可以确保我们只移除想要移除的那个维度，而不会意外地破坏其他原本就需要为 1 的维度（例如在多头注意力机制中，有时需要保留特定的 numheads 维度为 1）。

什么是 Unsqueeze（解压/扩张）？

与 INLINECODE287dcf1e 相反，INLINECODE5d4a90e1 允许我们在张量的指定位置插入一个大小为 1 的新维度。这在将一维向量转换为批量输入，或者为单个样本添加批次维度时非常有。

为什么需要 Unsqueeze？

假设你的模型期望接收一个形状为 INLINECODE3c580139 的输入，但你只有一个样本，形状是 INLINECODEa6e3eeb4。直接输入会导致报错。你需要使用 INLINECODEd62c7647 在第 0 维添加一个维度，把它变成 INLINECODEe3a6d2ff，伪装成一个“批次”。

语法与参数

> 语法： torch.unsqueeze(input, dim)

核心参数解析：

input (Tensor): 输入张量。
dim (int): 插入维度的索引。这是一个比较灵活的参数，允许使用负数索引（类似 Python 列表）。范围限制在 [-input.dim() - 1, input.dim() + 1) 之间。

示例 3：一维张量变二维张量

让我们把一个简单的一维数组变成二维的矩阵形式（行向量或列向量）。

import torch

# 定义一个包含 8 个元素的一维张量
# 形状为 [8]
input_tensor = torch.arange(8, dtype=torch.float)
print(f"原始张量: {input_tensor}")
print(f"原始形状: {input_tensor.size()}
")

# 在 dim=0 (最前面) 插入维度
# 形状变为 [1, 8]，类似于行向量的概念
front_dim = torch.unsqueeze(input_tensor, dim=0)
print(f"在 dim=0 扩张后形状: {front_dim.size()}")

# 在 dim=1 (最后面) 插入维度
# 形状变为 [8, 1]，类似于列向量的概念
back_dim = torch.unsqueeze(input_tensor, dim=1)
print(f"在 dim=1 扩张后形状: {back_dim.size()}")

输出结果：

原始张量: tensor([0., 1., 2., 3., 4., 5., 6., 7.])
原始形状: torch.Size([8])

在 dim=0 扩张后形状: torch.Size([1, 8])
在 dim=1 扩张后形状: torch.Size([8, 1])

示例 4：深入理解维度索引（负数索引）

当你处理高维张量时，从后面数位置往往更直观。PyTorch 的 unsqueeze 支持负数索引，这让操作变得非常便捷。

import torch

# 创建一个 2D 张量，形状 [3, 4]
input_tensor = torch.randn(3, 4)
print(f"原始形状: {input_tensor.size()}")

# 我们想在倒数第一的位置插入一个维度
# 也就是从 [3, 4] 变成 [3, 4, 1]
# 使用 dim=-1
tensor_neg = torch.unsqueeze(input_tensor, dim=-1)
print(f"使用 dim=-1 扩张后: {tensor_neg.size()}")

# 等价于 dim=2 (因为原始维度是 2，新索引最大可以是 2)
tensor_pos = torch.unsqueeze(input_tensor, dim=2)
print(f"使用 dim=2 扩张后:  {tensor_pos.size()}")

输出结果：

原始形状: torch.Size([3, 4])
使用 dim=-1 扩张后: torch.Size([3, 4, 1])
使用 dim=2 扩张后:  torch.Size([3, 4, 1])

实用见解： 在进行广播运算时，INLINECODE50f2fd7a 是必不可少的。比如你想让一个形状为 INLINECODEdd513acc 的向量与一个 INLINECODE1eda5cb4 的矩阵相加，你需要先将向量 INLINECODE04fa4662 变成 INLINECODE49e0564d，PyTorch 就会自动将其广播到 INLINECODEe175953c。

常见陷阱与最佳实践

在使用这两个函数时，我们总结了开发者最容易遇到的坑，以及相应的解决策略：

1. 只有维度大小为 1 才能被 Squeeze

错误场景：

t = torch.randn(2, 3) # 维度大小为 2 和 3
# 尝试压缩会怎样？
t_squeezed = torch.squeeze(t)

结果： 什么都不会发生。INLINECODEcddb5aa9 的形状依然是 INLINECODE26c4dbb4。
切记： INLINECODEe23dbd39 不会改变原始数据的内存布局，它只在逻辑上移除了“单例维度”。如果你想强制改变形状（比如把 4 变成 2×2），你需要使用 INLINECODEa2b79a7d 或 reshape()。

2. Unsqueeze 的范围限制

错误场景： 尝试在不存在的索引位置插入维度。

t = torch.randn(2, 3)
# 尝试在 dim=3 或 dim=-4 之外操作
torch.unsqueeze(t, dim=3) # 报错：Dimension out of range
torch.unsqueeze(t, dim=3)

解决方法： 对于形状 INLINECODE5853e0b4，合法的 INLINECODE5398ac55 范围是 INLINECODE57785f16。即 INLINECODEcc5cf3ef。在这个闭合区间内的整数都是合法的，对应着不同的插入位置。

3. 链式调用的可读性

在进行复杂的张量变换时，代码往往会变得很长。

# 这种写法很难一眼看出来最终形状是什么
x = torch.squeeze(torch.unsqueeze(x, 0), 2)

建议： 在每一步操作后打印形状，或者在注释中注明当前形状。

x = torch.unsqueeze(x, 0) # [N] -> [1, N]
x = torch.squeeze(x, 2)    # 此时 squeeze 可能无效，视中间结果而定

4. 性能提示

好消息是，INLINECODE901b0d8b 和 INLINECODE592572dc 都是“视图”操作。这意味着它们通常不会复制底层数据，只是改变了张量的“元数据”（即形状信息）。因此，它们的开销极小，你不需要担心性能问题，可以放心地在模型的前向传播中频繁使用它们来匹配维度。

总结

在 PyTorch 的学习之路上，维度管理是构建复杂神经网络的基础。

当你看到形状中多余的 INLINECODE2eafff76（比如 INLINECODEac6c34f3），记得使用 Squeeze 来清理它。
当你需要让数据“对齐”以进行矩阵乘法或广播时（比如把 INLINECODEe6865b5e 变成 INLINECODE5d02f4cf），记得使用 Unsqueeze 来增加那个通道维度。

最好的掌握方式就是动手实验。下次遇到 INLINECODE21aa37d6 时，不妨打印出 INLINECODE3898938c，看看是不是少了或者多了一个维度。现在，试着运行上面的代码，感受一下形状变化的乐趣吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

PyTorch 实战指南：深入理解 Squeeze 与 Unsqueeze 操作

什么是 Squeeze（压缩）？

为什么需要 Squeeze？

语法与参数

示例 1：基础的全局压缩

示例 2：精准控制——在指定维度上压缩

什么是 Unsqueeze（解压/扩张）？

为什么需要 Unsqueeze？

语法与参数

示例 3：一维张量变二维张量

示例 4：深入理解维度索引（负数索引）

常见陷阱与最佳实践

1. 只有维度大小为 1 才能被 Squeeze

2. Unsqueeze 的范围限制

3. 链式调用的可读性

4. 性能提示

总结

相关文章美国1G带宽/1T流量高速vps $17.99/年