如何创建 Google Cloud Storage 存储桶？深入指南与最佳实践

2026-02-15 17:01:04 0条评论 2次阅读 0人点赞

0.1 前言：为什么我们需要 Google Cloud Storage？
0.2 理解核心概念：什么是存储桶和对象？
0.3 核心功能与生产级特性
0.4 方法一：通过 Google Cloud Console 可视化创建
0.5 方法二：使用 Command Line (gsutil) 自动化部署

1 确保你的环境变量 GOOGLEAPPLICATIONCREDENTIALS 指向了你的 JSON 密钥文件
2 或者，你可以直接在代码中传递凭据（不推荐用于生产环境）
3 实际调用示例
4 使用示例
5 假设本地有一个 ‘images‘ 文件夹，我们想把里面的图片上传到云端的 ‘assets/images/‘ 路径
6 uploadfilesto_bucket("my-python-controlled-bucket-v1", "./images", "assets/images")
7 使用场景：用户点击邮件中的下载链接，后端生成该 URL 返回给前端
8 generatedownloadsigned_url("my-python-controlled-bucket-v1", "assets/images/profile.jpg")
- 8.1 总结与下一步

前言：为什么我们需要 Google Cloud Storage？

在现代云原生的应用架构中，如何高效、安全且可扩展地存储非结构化数据（如图片、视频、日志备份和大型二进制文件），是每一个后端工程师和数据工程师必须面对的挑战。今天，我们将深入探讨 Google Cloud Platform (GCP) 提供的核心存储解决方案——Google Cloud Storage (GCS)。

无论你正在构建一个需要处理海量用户上传内容的社交媒体应用，还是需要为公司建立可靠的数据湖，GCS 的“存储桶”都是一切的基础。在这篇文章中，我们将不仅学习如何通过控制台和代码创建一个存储桶，还会深入理解其背后的配置逻辑，以及如何通过代码实现自动化管理。我们将一起探索从零开始的搭建过程，并分享在实际生产环境中的最佳实践。

理解核心概念：什么是存储桶和对象？

在动手之前，让我们先明确几个核心概念，这有助于我们在后续的配置中做出正确的决策。

1. 对象存储的本质

与传统的文件系统不同，Google Cloud Storage 是一个对象存储系统。在这里，数据被作为“对象”存储，而不仅仅是文件。每个对象由三个部分组成：

数据本身： 即文件内容。
元数据： 描述数据的信息（例如文件类型、创建时间、自定义标签等）。
唯一键： 对象在存储桶中的名称（类似于文件路径）。

2. 存储桶

存储桶是对象的容器。你可以把它想象成一个无限的云硬盘，但它比普通硬盘更强大。每个存储桶在全球范围内具有唯一的名称，这意味如果你的项目名为 INLINECODE54fb772e，那么 INLINECODE2ac2e868 这个名称一旦被其他 GCP 用户占用，你就无法使用。存储桶用于组织数据，并应用统一的访问规则和生命周期管理策略。

3. 存储类别与位置

为了实现成本优化和性能平衡，我们需要了解数据的“温度”。GCS 提供了多种存储类别，例如 Standard（标准，适合频繁访问）、Nearline（近线，适合访问频率较低的数据）、Coldline（冷线，适合归档）和 Archive（归档，极少访问）。在创建存储桶时，选择正确的位置（区域 Region 或双区域 Dual-region）对于数据冗余和访问延迟至关重要。

核心功能与生产级特性

Google Cloud Storage 不仅仅是存储文件那么简单，它提供了许多企业级功能，让我们能够像管理数据库一样管理文件：

版本控制： 这是一个“后悔药”功能。开启后，即使我们覆盖或删除了文件，GCS 也会保留旧版本。这对于防止意外数据丢失和进行数据审计至关重要。
细粒度的访问控制： 我们可以统一管理权限。例如，你可以设置某个存储桶下的特定目录只能被特定的服务账号读取，或者通过签名 URL (Signed URL) 实现临时的公开下载链接。
生命周期管理： 这是成本优化的利器。我们可以编写规则，例如“将创建超过 30 天的日志文件自动从 Standard 转为 Nearline 以降低成本”，或者“将超过 1 年的备份自动删除”。通过自动化策略，我们无需手动清理过期数据。
数据传输与加密： 所有数据在传输中和存储时默认加密。GCS 还提供了高性能传输服务，帮助我们快速将海量数据从本地迁移到云端。

方法一：通过 Google Cloud Console 可视化创建

对于初学者或快速测试来说，图形用户界面是最直观的方式。让我们一步步操作。

步骤 1：访问控制台

首先，我们需要登录 Google Cloud Console。在左侧导航栏中，找到“存储”部分。如果你是第一次使用，系统可能会提示你创建一个项目。

步骤 2：创建存储桶

进入 Cloud Storage 页面后，点击顶部的 “创建存储桶” 按钮。

步骤 3：命名（关键步骤）

在命名页面，我们需要输入一个全局唯一的名称。这里有几个严格的命名规则：

只能包含小写字母、数字、破折号（-）和下划线（_）。
必须以字母或数字开头和结尾。
长度必须在 3 到 63 个字符之间。

命名建议： 尽量使用项目名称或域名作为前缀，例如 my-company-prod-assets。如果提示名称已存在，尝试添加随机数字后缀。
步骤 4：选择位置类型

这是决定性能和合规性的关键步骤：

单区域： 数据只存储在一个特定的地理区域（如 us-central1）。价格最低，延迟最低（如果用户就在附近），但容灾能力相对较弱。
双区域： 数据在两个特定的区域冗余存储（如 us-east1 和 us-west1）。适合高可用性需求。
多区域： 数据在大范围内（如整个美国或整个欧盟）冗余存储。适合访问量极其巨大的互联网应用。

实战经验： 如果你的用户主要在中国大陆，可以选择位于香港或台湾的区域以优化访问延迟。同时，请务必检查数据合规性要求，确保数据的存储位置符合当地法律。
步骤 5：选择存储类别

Standard（标准）： 默认选项，适合频繁访问的数据。
Nearline（近线）： 适合每月访问不到一次的数据。
Coldline（冷线）： 适合每年访问不到一次的数据。

注意： 在创建存储桶时选择的只是“默认”存储类别。我们稍后可以在上传文件时针对特定文件单独设置类别。
步骤 6：访问控制

统一： 推荐选项。意味着我们可以使用 IAM（身份和访问管理）来集中控制谁可以访问这个存储桶。这也是安全性最高的方式。
细粒度： 允许在单个对象级别设置 ACL。虽然灵活，但管理复杂，容易出错，通常不推荐使用，除非你有特殊的遗留系统需求。

步骤 7：高级设置与保护工具

在这里，我们可以勾选以下选项：

访问控制： 强制公开访问预防。这可以防止意外将敏感数据泄露到互联网。强烈建议开启。
对象版本控制： 勾选此选项以保留对象的历史版本。
保留策略： 锁定数据，防止在特定时间前被删除或覆盖。

点击 “创建”，稍等片刻，你的存储桶就准备好了。

方法二：使用 Command Line (gsutil) 自动化部署

如果你需要批量创建存储桶，或者在 CI/CD 流水线中进行部署，使用命令行工具 gsutil 是最高效的方法。

首先，请确保你已经安装了 Google Cloud SDK 并完成了初始化 (gcloud init)。

基础创建命令

让我们尝试创建一个名为 INLINECODEa3905663 的存储桶，位置设为 INLINECODEa1c4fefb（台湾），并指定为 Nearline 存储类别。

# 创建存储桶的基本语法
# mb = make bucket
# -p 指定位置
# -c 指定存储类别

gsutil mb -p asia-east1 -c nearline gs://my-cli-bucket-12345

代码解释：

gsutil：Google Cloud Storage 的命令行工具。
mb：Make Bucket 的缩写。
-p asia-east1：指定存储桶位于亚洲东部。这有助于降低亚洲用户的延迟。
-c nearline：将默认存储类别设置为 Nearline。如果你只是用来做日志归档，这能节省大约 50% 的存储成本。
gs://...：GCS 的 URI 格式。

验证创建结果

# 列出你账户下的所有存储桶
gsutil ls

你将看到新创建的存储桶出现在列表中。

高级操作：设置生命周期策略

通过命令行，我们可以直接为存储桶添加生命周期规则。例如，让我们创建一个 JSON 文件来定义规则：删除超过 30 天的对象。

首先，创建一个名为 lifecycle.json 的文件：

{
  "lifecycle": {
    "rule": [
    {
      "action": {"type": "Delete"},
      "condition": {"age": 30}
    }
    ]
  }
}
``

然后，应用这个规则到我们的存储桶：

bash

gsutil lifecycle set lifecycle.json gs://my-cli-bucket-12345


这样做之后，任何在这个存储桶中创建超过 30 天的文件都会被系统自动清理，这对于临时文件或日志存储非常有用。


## 方法三：使用 Python 代码进行编程控制

对于开发者来说，最灵活的方式莫过于使用代码直接管理云资源。Google Cloud 提供了功能强大的 Python 客户端库 `google-cloud-storage`。

### 准备工作
首先，你需要安装客户端库并配置认证。

bash

pip install google-cloud-storage


### 场景一：创建存储桶并启用版本控制

让我们编写一个 Python 脚本，它不仅会创建存储桶，还会展示如何配置版本控制。

python

from google.cloud import storage

import os

确保你的环境变量 GOOGLEAPPLICATIONCREDENTIALS 指向了你的 JSON 密钥文件

或者，你可以直接在代码中传递凭据（不推荐用于生产环境）

def createbucketclasslocation(bucketname):

"""

在特定位置创建存储桶并启用版本控制。

"""

# storage.Client() 会自动读取环境变量中的凭证

storage_client = storage.Client()

# 定义存储桶名称

bucket = storageclient.bucket(bucketname)

# 创建存储桶，指定位置为 ‘US‘

# 如果你想指定其他区域，可以使用 ‘asia-east1‘, ‘europe-west1‘ 等

bucket.location = ‘US‘

# 启用版本控制 – 这是一个生产环境的最佳实践

bucket.versioning_enabled = True

print(f"正在创建存储桶 {bucket_name}… 请稍候")

# 实际执行创建操作

bucket.create()

print(f"存储桶 {bucket_name} 已成功创建在 {bucket.location} 位置，并已启用版本控制。")

return bucket

实际调用示例

if name == ‘main‘:

# 请将下面的名称替换为你自己的唯一名称

createbucketclass_location("my-python-controlled-bucket-v1")


**代码深度解析：**
1.  **认证机制：** `storage.Client()` 默认会寻找 `GOOGLE_APPLICATION_CREDENTIALS` 环境变量。这是 Google Cloud 认证的标准方式，比硬编码密钥安全得多。
2.  **版本控制开启：** `bucket.versioning_enabled = True` 这一行代码非常关键。在开发环境中，我们经常需要覆盖配置文件，开启版本控制可以让我们随时回滚到上一个版本的配置。
3.  **异步与同步：** `bucket.create()` 是一个同步操作，通常会返回直到资源创建完成（或失败）。

### 场景二：批量上传文件

创建好存储桶后，我们通常会立即上传数据。以下是一个实用的批量上传脚本：

python

def uploadfilestobucket(bucketname, sourcefolder, destinationblob_prefix):

"""

将本地文件夹中的所有文件上传到 GCS 存储桶

"""

storage_client = storage.Client()

bucket = storageclient.bucket(bucketname)

# 遍历本地文件夹

for filename in os.listdir(source_folder):

sourcefilepath = os.path.join(source_folder, filename)

# 如果是文件（跳过子文件夹），则上传

if os.path.isfile(sourcefilepath):

# 构建 GCS 上的对象路径

# blob_name 是对象在云端的唯一标识，可以包含斜杠来模拟目录结构

blobname = f"{destinationblob_prefix}/{filename}"

blob = bucket.blob(blob_name)

print(f"正在上传: {filename} 到 {blob_name}")

# uploadfromfilename 方法会自动处理大文件的分块上传

blob.uploadfromfilename(sourcefilepath)

print(f"成功上传: {filename}")

使用示例

假设本地有一个 ‘images‘ 文件夹，我们想把里面的图片上传到云端的 ‘assets/images/‘ 路径

uploadfilesto_bucket("my-python-controlled-bucket-v1", "./images", "assets/images")

CODEBLOCKd92183b8pythonndef generatedownloadsignedurl(bucketname, sourceblob_name):

"""

生成一个临时下载链接，有效期 10 分钟

"""

storage_client = storage.Client()

bucket = storageclient.bucket(bucketname)

blob = bucket.blob(sourceblobname)

# 生成 URL，设置过期时间为当前时间 + 10 分钟

url = blob.generatesignedurl(

version="v4",

# 这里的 expiration 是时间戳对象

expiration=datetime.timedelta(minutes=10),

method="GET",

)

print(f"生成的签名 URL: {url}")

return url

使用场景：用户点击邮件中的下载链接，后端生成该 URL 返回给前端

generatedownloadsigned_url("my-python-controlled-bucket-v1", "assets/images/profile.jpg")

“INLINECODE55ad879c409 BucketAlreadyExistsINLINECODEf38beb5c409 ConflictINLINECODEb46c0786403 Access DeniedINLINECODE5a6e9751Storage AdminINLINECODEc43048a9Storage Object AdminINLINECODE[email protected]9959848cStorage Object AdminINLINECODE2d1593dbblob.updatestorageclass(‘NEARLINE‘)INLINECODEc3c393e5storage.Client()INLINECODE2d536134allUsers` 可读。如果必须托管静态网站（如 React 或 Vue 应用），请确保只将静态资源设置为可读，并配合 Cloud CDN 使用。更好的做法是使用负载均衡器 (Cloud Load Balancing) 结合私有存储桶来对外提供服务，这样所有请求都经过认证，安全性更高。

总结与下一步

在本文中，我们全面地学习了如何创建 Google Cloud Storage 存储桶，从控制台的基础操作到命令行的自动化，再到 Python 代码的编程控制。我们不仅创建了容器，还学习了如何管理生命周期、控制访问权限以及处理文件上传。

掌握了这些技能后，你可以尝试以下挑战来巩固知识：

构建一个自动化脚本： 每天自动将本地数据库备份上传到 GCS，并自动删除 30 天前的旧备份。
触发函数： 探索 Google Cloud Functions，尝试实现这样一个功能：每当有新图片上传到存储桶时，自动触发一个函数进行图片缩放处理。

希望这篇文章能帮助你更好地理解和使用 Google Cloud Platform。无论你是为了构建下一个独角兽应用，还是为了优化公司的数据架构，GCS 都是你坚实的后盾。开始动手吧！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客

如何创建 Google Cloud Storage 存储桶？深入指南与最佳实践

前言：为什么我们需要 Google Cloud Storage？

理解核心概念：什么是存储桶和对象？

1. 对象存储的本质

2. 存储桶

3. 存储类别与位置

核心功能与生产级特性

方法一：通过 Google Cloud Console 可视化创建

方法二：使用 Command Line (gsutil) 自动化部署

基础创建命令

验证创建结果

高级操作：设置生命周期策略

确保你的环境变量 GOOGLEAPPLICATIONCREDENTIALS 指向了你的 JSON 密钥文件

或者，你可以直接在代码中传递凭据（不推荐用于生产环境）

实际调用示例

使用示例

假设本地有一个 ‘images‘ 文件夹，我们想把里面的图片上传到云端的 ‘assets/images/‘ 路径

uploadfilesto_bucket("my-python-controlled-bucket-v1", "./images", "assets/images")

使用场景：用户点击邮件中的下载链接，后端生成该 URL 返回给前端

generatedownloadsigned_url("my-python-controlled-bucket-v1", "assets/images/profile.jpg")

总结与下一步

相关文章美国1G带宽/1T流量高速vps $17.99/年