豆丁博客

如何在 GCP 上使用 Cloud Speech-to-Text 进行语音识别？

2026-02-14 12:56:10 0条评论 77次阅读 0人点赞

Google Cloud Platform (GCP) 是市场上最著名的云服务提供商之一。虽然云服务主要侧重于部署和存储，但 GCP 也提供了像语音识别这样强大的功能。这个强大且易于使用的服务被称为 Cloud Speech-to-Text。这项功能使开发人员能够高精度地将口语转换为文本。我们可以将语音转文本集成到应用程序中以提供转录功能，企业也可以利用这一点来提升无障碍访问体验。在本文中，我们将深入探讨 GCP 提供的 Cloud Speech-to-Text 服务，并学习如何使用这一功能来获取语音的转录文本。

核心术语

Google Cloud Platform (GCP): Google Cloud Platform 是 Google 提供的一套云计算服务。GCP 提供的服务包括计算、存储、机器学习等。你可以查阅相关教程来了解 Google Cloud Platform 的更多内容。
Cloud Speech-to-Text: Cloud speech-to-text 是 GCP 上的一项服务，它使开发人员能够利用 Google 的语音识别技术将音频输入转换为文本。这项服务可以通过 API 集成到其他应用程序中，有助于提供更好的无障碍服务。

在 GCP 上使用 Cloud Speech-To-Text 进行语音识别的步骤

步骤 1：打开 GCP 云控制台

在你的网络浏览器中打开 Google Cloud Platform 的登录页面，并使用你的有效凭证登录。
你必须拥有一个有效的订阅计划才能使用我们将要使用的服务。
确保你有一个活跃的订阅或试用计划。

步骤 2：启用 Cloud Speech-To-Text API

一旦你登录到 GCP 控制台，请导航至 "API & Services" 部分。
点击 "Enable APIs and Services"。

!启用 API 和服务

这将打开一个搜索栏来搜索所需的 API。搜索 "Cloud Speech-to-Text API"。

点击它，这将显示有关此 API 的详细信息。点击 enable（启用）为你的项目启用此 API。

!Cloud Speech To Text API

步骤 3：创建服务账户

接下来，我们需要创建一个服务账户来生成密钥（Key），这将帮助我们验证我们的请求。
服务账户是一种特殊类型的账户，供应用程序和虚拟机 (Virtual Machines) 使用，用于验证身份以及与其他 GCP 服务和 API 进行交互。
导航到 "APIs & Services" 并点击 "Credentials"。

点击 "Create Credentials" 并选择 "Service Account"。

现在给这个服务账户起个名字，然后点击 "Create and continue"。

!服务账户详情

对于 Role（角色），选择 owner（所有者），然后点击 Continue（继续）。

!定义角色和条件

将所有其他详细信息保留为默认/预设值。点击 Done（完成）。

步骤 4：创建 JSON 密钥

JSON 密钥，也被称为 Service Account Key（服务账户密钥）或 Credentials File（凭据文件）。
它是一种 JSON (JavaScript Object Notation) 文件格式，包含 Google Cloud Platform 上服务账户的身份验证信息。

相关文章美国1G带宽/1T流量高速vps $17.99/年