Google Cloud Platform (GCP) 是市场上最著名的云服务提供商之一。虽然云服务主要侧重于部署和存储,但 GCP 也提供了像语音识别这样强大的功能。这个强大且易于使用的服务被称为 Cloud Speech-to-Text。这项功能使开发人员能够高精度地将口语转换为文本。我们可以将语音转文本集成到应用程序中以提供转录功能,企业也可以利用这一点来提升无障碍访问体验。在本文中,我们将深入探讨 GCP 提供的 Cloud Speech-to-Text 服务,并学习如何使用这一功能来获取语音的转录文本。
核心术语
- Google Cloud Platform (GCP): Google Cloud Platform 是 Google 提供的一套云计算服务。GCP 提供的服务包括计算、存储、机器学习等。你可以查阅相关教程来了解 Google Cloud Platform 的更多内容。
- Cloud Speech-to-Text: Cloud speech-to-text 是 GCP 上的一项服务,它使开发人员能够利用 Google 的语音识别技术将音频输入转换为文本。这项服务可以通过 API 集成到其他应用程序中,有助于提供更好的无障碍服务。
在 GCP 上使用 Cloud Speech-To-Text 进行语音识别的步骤
步骤 1:打开 GCP 云控制台
- 在你的网络浏览器中打开 Google Cloud Platform 的登录页面,并使用你的有效凭证登录。
- 你必须拥有一个有效的订阅计划才能使用我们将要使用的服务。
- 确保你有一个活跃的订阅或试用计划。
步骤 2:启用 Cloud Speech-To-Text API
- 一旦你登录到 GCP 控制台,请导航至 "API & Services" 部分。
- 点击 "Enable APIs and Services"。
- 这将打开一个搜索栏来搜索所需的 API。搜索 "Cloud Speech-to-Text API"。
- 点击它,这将显示有关此 API 的详细信息。点击 enable(启用)为你的项目启用此 API。
步骤 3:创建服务账户
- 接下来,我们需要创建一个服务账户来生成密钥(Key),这将帮助我们验证我们的请求。
- 服务账户是一种特殊类型的账户,供应用程序和虚拟机 (Virtual Machines) 使用,用于验证身份以及与其他 GCP 服务和 API 进行交互。
- 导航到 "APIs & Services" 并点击 "Credentials"。
- 点击 "Create Credentials" 并选择 "Service Account"。
!创建凭据
- 现在给这个服务账户起个名字,然后点击 "Create and continue"。
- 对于 Role(角色),选择 owner(所有者),然后点击 Continue(继续)。
- 将所有其他详细信息保留为默认/预设值。点击 Done(完成)。
步骤 4:创建 JSON 密钥
- JSON 密钥,也被称为 Service Account Key(服务账户密钥)或 Credentials File(凭据文件)。
- 它是一种 JSON (JavaScript Object Notation) 文件格式,包含 Google Cloud Platform 上服务账户的身份验证信息。