如何在 GCP 上使用 Cloud Speech-to-Text 进行语音识别?

Google Cloud Platform (GCP) 是市场上最著名的云服务提供商之一。虽然云服务主要侧重于部署和存储,但 GCP 也提供了像语音识别这样强大的功能。这个强大且易于使用的服务被称为 Cloud Speech-to-Text。这项功能使开发人员能够高精度地将口语转换为文本。我们可以将语音转文本集成到应用程序中以提供转录功能,企业也可以利用这一点来提升无障碍访问体验。在本文中,我们将深入探讨 GCP 提供的 Cloud Speech-to-Text 服务,并学习如何使用这一功能来获取语音的转录文本。

核心术语

  • Google Cloud Platform (GCP): Google Cloud Platform 是 Google 提供的一套云计算服务。GCP 提供的服务包括计算、存储、机器学习等。你可以查阅相关教程来了解 Google Cloud Platform 的更多内容。
  • Cloud Speech-to-Text: Cloud speech-to-text 是 GCP 上的一项服务,它使开发人员能够利用 Google 的语音识别技术将音频输入转换为文本。这项服务可以通过 API 集成到其他应用程序中,有助于提供更好的无障碍服务。

在 GCP 上使用 Cloud Speech-To-Text 进行语音识别的步骤

步骤 1:打开 GCP 云控制台

  • 在你的网络浏览器中打开 Google Cloud Platform 的登录页面,并使用你的有效凭证登录。
  • 你必须拥有一个有效的订阅计划才能使用我们将要使用的服务。
  • 确保你有一个活跃的订阅或试用计划。

步骤 2:启用 Cloud Speech-To-Text API

  • 一旦你登录到 GCP 控制台,请导航至 "API & Services" 部分。
  • 点击 "Enable APIs and Services"。

!启用 API 和服务

  • 这将打开一个搜索栏来搜索所需的 API。搜索 "Cloud Speech-to-Text API"。

!API 库

  • 点击它,这将显示有关此 API 的详细信息。点击 enable(启用)为你的项目启用此 API。

!Cloud Speech To Text API

步骤 3:创建服务账户

  • 接下来,我们需要创建一个服务账户来生成密钥(Key),这将帮助我们验证我们的请求。
  • 服务账户是一种特殊类型的账户,供应用程序和虚拟机 (Virtual Machines) 使用,用于验证身份以及与其他 GCP 服务和 API 进行交互。
  • 导航到 "APIs & Services" 并点击 "Credentials"。

!API 和服务

  • 点击 "Create Credentials" 并选择 "Service Account"。

!创建凭据

  • 现在给这个服务账户起个名字,然后点击 "Create and continue"。

!服务账户详情

  • 对于 Role(角色),选择 owner(所有者),然后点击 Continue(继续)。

!定义角色和条件

  • 将所有其他详细信息保留为默认/预设值。点击 Done(完成)。

步骤 4:创建 JSON 密钥

  • JSON 密钥,也被称为 Service Account Key(服务账户密钥)或 Credentials File(凭据文件)。
  • 它是一种 JSON (JavaScript Object Notation) 文件格式,包含 Google Cloud Platform 上服务账户的身份验证信息。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。如需转载,请注明文章出处豆丁博客和来源网址。https://shluqu.cn/49446.html
点赞
0.00 平均评分 (0% 分数) - 0