如何从 AWS S3 下载文件夹：CLI 与 UI 操作指南

2026-02-13 15:53:48 0条评论 123次阅读 0人点赞

作为一名开发者或系统管理员，你是否经常需要在本地和 Amazon S3 之间同步数据？特别是当需要处理大量文件或整个目录结构时，仅仅下载单个文件往往无法满足需求。在这篇文章中，我们将深入探讨如何使用 AWS Command Line Interface (CLI) 和 AWS Management Console（即 UI）高效、安全地从 S3 存储桶下载整个文件夹。

无论你是刚刚开始接触 AWS 云服务的新手，还是希望优化数据迁移流程的资深工程师，掌握这两种方法都至关重要。我们将通过实际的操作步骤、代码示例以及最佳实践，带你一步步完成从环境配置到数据下载的全过程。

1 什么是 Amazon S3？
2 前置准备：账户与权限配置
3 准备测试数据：创建 S3 桶与文件夹
4 方法一：使用 AWS CLI 下载文件夹（推荐）
5 方法二：使用 AWS 管理控制台（UI）下载
6 深入理解：Sync 与 CP 的区别
7 常见错误与解决方案
8 性能优化与最佳实践
9 总结

什么是 Amazon S3？

在开始操作之前，让我们先简单回顾一下核心概念。Amazon Simple Storage Service (S3) 是 AWS 提供的对象存储服务。它不仅仅是硬盘的云端延伸，更是一个具有极高扩展性、可用性和持久性的存储系统。

在 S3 中，数据被存储为“对象”，而这些对象则被组织在称为“存储桶”的容器中。你可以把存储桶想象成一个无限的文件夹，里面可以包含无数的文件和子目录。为了方便管理，我们在控制台或 CLI 中通常会以“文件夹”的形式来组织和查看这些对象，尽管在底层 API 层面，它们都是键值对形式存在的对象。

前置准备：账户与权限配置

在进行任何操作之前，我们需要确保拥有正确的访问权限。安全始终是云端操作的首要原则。

我们强烈建议不要使用 AWS 账户的根用户凭证来进行日常的 S3 操作。相反，你应该创建一个 IAM（Identity and Access Management）用户，并为其分配适当的权限策略。

创建 IAM 用户：登录 AWS 控制台，进入 IAM 服务面板，创建一个新用户。
附加策略：为了能够下载文件，该用户至少需要拥有 INLINECODEf3fda7b9 策略。如果你需要完全的读写控制，可以附加 INLINECODE1b0a16f9。
获取访问密钥：在创建用户后，系统会生成一对密钥：INLINECODE6bc68b88 和 INLINECODE35d0ac84。请务必妥善保管这两个字符串，稍后我们在配置 CLI 时会用到它们。

准备测试数据：创建 S3 桶与文件夹

为了演示下载过程，我们需要先在云端准备好一些数据。让我们通过 UI 来完成这一步。

步骤 1：登录并创建存储桶

首先，打开浏览器并登录 Amazon 控制台。在服务列表中搜索并选择 S3。

点击左侧导航栏的“存储桶”，然后点击右上角的“创建存储桶”按钮。

桶名称：输入一个全局唯一的名称（例如 my-unique-backup-bucket-2024）。注意，S3 桶名称在全局所有 AWS 账户中必须是唯一的。
AWS 区域：选择一个离你或你的用户最近的数据中心区域（例如“亚太地区-新加坡”）。

保持其他选项为默认状态，点击页面底部的“创建存储桶”。

步骤 2：上传与组织文件

创建成功后，你会进入存储桶的详情页面。让我们模拟一个实际场景：我们要备份一个包含图片和文档的项目文件夹。

点击“创建文件夹”图标，命名为 project-files。
点击刚刚创建的文件夹，进入其中。
点击“上传”按钮，添加一些本地文件。为了测试，你可以上传 3 张不同的图片或文本文档。

这样，我们就拥有了一个包含数据的 S3 环境，接下来的任务就是学会如何把它取回来。

方法一：使用 AWS CLI 下载文件夹（推荐）

对于开发者来说，命令行界面（CLI）是最高效的工具。它不仅速度快，而且可以通过脚本自动化，非常适合处理大规模数据传输。

步骤 3：安装 AWS CLI

AWS CLI 是一个开源工具，允许我们在终端中直接与 AWS 服务进行交互。如果你还没有安装，可以通过以下命令进行安装（以 macOS 为例）：

# 使用 curl 下载安装包
curl "https://awscli.amazonaws.com/AWSCLIV2.pkg" -o "AWSCLIV2.pkg"

# 使用 installer 安装
sudo installer -pkg AWSCLIV2.pkg -target /

注：Windows 或 Linux 用户请参考官方文档使用 MSI 安装包或 pip 进行安装。

安装完成后，打开一个新的终端窗口，输入以下命令以验证安装是否成功：

aws --version

如果系统返回了版本号（例如 aws-cli/2.x.x），说明安装无误。

步骤 4：配置凭证

现在，我们需要告诉 CLI 我们是谁（也就是验证身份）。在终端中运行：

aws configure

执行后，系统会依次提示你输入以下信息：

AWS Access Key ID：输入前文提到的 IAM 用户 Access Key。
AWS Secret Access Key：输入对应的 Secret Key。
Default region name：输入你创建 S3 桶时选择的区域代码（例如 INLINECODEa2be4d10 或 INLINECODE8a69cfce）。
Default output format：输入 json（推荐），以便于阅读返回结果。

步骤 5：使用 CLI 下载文件夹的核心命令

这是本文的重点。在 AWS CLI 中，我们不直接使用 INLINECODEa1f0cbd6 来下载文件夹，而是使用 INLINECODE4e5295fb 或 cp 命令。

#### 场景 A：下载整个存储桶

如果你想备份整个存储桶的内容到本地当前目录，可以使用 INLINECODE433f6b93 命令。INLINECODE76df5747 命令非常智能，它只会复制源中有而目标中没有的文件，非常高效。

# 语法：aws s3 sync  
# 示例：将 my-unique-backup-bucket-2024 的内容同步到当前目录
aws s3 sync s3://my-unique-backup-bucket-2024 .

解释：

s3://...：这是 S3 的 URI 格式。
.：代表本地的当前目录。
执行后，你会看到终端中显示传输进度。所有文件，包括子文件夹中的文件，都会被下载下来。

#### 场景 B：下载特定的子文件夹

更多时候，我们只需要下载存储桶中的某一个文件夹。例如，我们只需要 project-files 文件夹。虽然 S3 中没有真正的“目录”，但我们可以通过键前缀来模拟。

# 下载指定的文件夹到本地
# 这里的命令会将远程的 project-files 文件夹同步到本地的 ./project-files 目录
aws s3 sync s3://my-unique-backup-bucket-2024/project-files ./local-project-backup

实用见解： 使用 INLINECODE01dc662b 而不是 INLINECODE8d259beb 的一个巨大优势在于断点续传和增量更新。如果下载过程中网络中断，或者你稍后再次运行该命令，AWS CLI 只会下载那些本地尚不存在的文件，而不会浪费时间重新下载已有的文件。

#### 场景 C：使用 –exclude 和 –include 进行过滤

作为进阶技巧，你可能会遇到只想下载某种特定类型文件的情况。例如，只想下载日志文件（.log）而忽略图片。我们可以添加参数来实现这一点：

# 只下载 .txt 文件，排除其他所有文件
aws s3 sync s3://my-unique-backup-bucket-2024 . --exclude "*" --include "*.txt"

步骤 6：验证下载结果

下载完成后，我们可以使用命令行查看本地文件来验证：

# 列出当前目录下的文件和文件夹
ls -l

# 或者进入文件夹查看内容
cd local-project-backup && ls

你应该能看到与 S3 上一致的文件结构。

方法二：使用 AWS 管理控制台（UI）下载

如果你不习惯使用命令行，或者只需要下载一次，AWS Web 界面提供了一个直观的替代方案。

步骤 1：定位并选择文件夹

回到 S3 控制台的存储桶列表。
点击你的存储桶名称进入详情页。
勾选你想要下载的文件夹名称左侧的复选框（例如 project-files）。

步骤 2：下载操作

点击上方的“下载”按钮。

这里有一个重要的细节需要注意：

如果你直接点击下载，S3 会尝试将所有文件打包。然而，浏览器在处理大量文件或大文件夹时可能会变得非常缓慢，甚至提示无法下载。

最佳实践： AWS 控制台通常会建议你下载一个清单文件或通过 AWS Transfer for S3 这样的服务来处理。但在简单的测试环境下，如果文件夹较小，点击下载后，S3 会生成一个任务来追踪下载进度。

如果在 UI 中遇到困难，对于包含大量对象的文件夹，我们强烈建议回到 CLI 方法，或者在对象列表中手动勾选具体的文件进行批量下载。这种方法在处理小型子文件夹时非常直观：右键点击文件夹 -> 下载。

深入理解：Sync 与 CP 的区别

在之前的步骤中，我们使用了 INLINECODEaa69bb10 命令。你可能会好奇，为什么不使用 INLINECODEff5cb080（复制）？让我们深入讲解一下它们的区别，这有助于你在实际工作中做出正确的选择。

aws s3 cp (Copy)：这是一个简单的“复制”指令。如果你运行 INLINECODEd4a725be，它会下载 INLINECODEae774be7 目录下的文件，但不会递归下载子目录中的文件，除非你加上 --recursive 参数。它更像是 1 对 1 的搬运。

    # 使用 cp 递归下载（类似于 sync，但逻辑稍有不同）
    aws s3 cp s3://my-unique-backup-bucket-2024/project-files . --recursive

aws s3 sync (Synchronize)：这是“同步”指令。它的核心逻辑是让目标目录与源目录保持一致。它会检查源目录和目标目录的 MD5 校验和。

* 如果目标文件夹里已经有了某个文件，且内容没有变化，sync 就会跳过它。

* 如果源文件删除了，INLINECODE1497e47a 默认不会删除本地的对应文件（除非加上 INLINECODEf12109cf 参数）。

实战建议：

如果你是第一次备份数据，两者效果相差不大。
如果你是定期更新备份（例如每天运行一次脚本），请务必使用 sync。这将节省大量的带宽和时间。

常见错误与解决方案

在操作过程中，你可能会遇到一些常见问题。让我们来看看如何解决它们。

错误 1：An error occurred (403) when calling the HeadObject operation

原因：权限不足。你的 IAM 用户可能没有读取该特定存储桶或对象的权限。
解决：

检查存储桶策略。确保你的 IAM 用户 ARN 被允许 s3:GetObject。
检查是否有任何显式的 Deny 策略。
确保对象没有使用 AWS KMS 加密密钥进行加密，而你却没有使用该密钥的权限。

错误 2：Unknown output type

原因：在 INLINECODEc07c4168 时，INLINECODE0670c3c0 输入了错误的值（例如输入了中文）。
解决：重新运行配置，或者直接编辑 INLINECODEcb20fed1 文件，将 INLINECODE62cee8b9 设置为 INLINECODE8f81744a、INLINECODEb74edb59 或 table。

错误 3：下载速度慢

原因：跨国传输带宽限制或本地网络拥堵。
解决：AWS CLI 默认使用多线程传输来提高速度。但你可以通过参数手动调整并发数：

# 使用 max_concurrent_requests 增加并发请求，默认值为 10
aws s3 sync s3://my-unique-backup-bucket-2024 . --max-concurrent-requests 20

性能优化与最佳实践

为了让你在使用 AWS S3 时更加得心应手，这里有几条进阶建议：

使用预签名 URL 共享：如果你需要把 S3 上的文件夹分享给非 AWS 用户（例如客户或合作伙伴），不要把你的密钥给他们。你可以使用 CLI 生成一个临时的下载链接：

    # 生成一个有效期为 3600 秒的下载链接
    aws s3 presign s3://my-unique-backup-bucket-2024/project-files/data.zip --expires-in 3600

注：presign 主要针对单个对象。对于文件夹，通常需要先打包再生成链接。

成本优化：请记住 AWS 的数据传输定价。从 S3 下载到互联网（你的本地电脑）通常会产生流量费用。如果数据量巨大（TB 级别），建议使用 AWS Snowball 物理传输设备，而不是通过网络下载。

脚本化与自动化：将下载命令保存为 Shell 脚本（INLINECODE8229f817）或批处理文件（INLINECODE8e5d4a54）。这样，你可以在需要时一键同步数据，而无需每次都手动输入命令。

总结

在这篇文章中，我们不仅学习了如何下载文件，更重要的是掌握了如何在云端和本地之间高效地管理数据流。

我们首先了解了 S3 的基本概念，接着通过实战完成了 IAM 用户的创建和 CLI 的配置。我们对比了 CLI 和 UI 两种操作方式，并深入探讨了 sync 命令的强大之处，这是处理大文件夹时的最佳选择。

当你下次面对“如何从 AWS S3 下载文件夹”这个问题时，你应该已经知道：

使用 CLI 的 sync 命令来处理复杂的目录结构和大量文件。
使用 UI 控制台来快速查看或下载少量文件。
始终关注 IAM 权限的安全性，避免暴露根账户密钥。

希望这篇指南能帮助你在云端开发的路上走得更加顺畅。现在，打开你的终端，尝试同步你的第一个 S3 存储桶吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客