machine-learning - 如何检测谷歌云平台机器学习语音api

如何检测谷歌云平台机器学习语音api

时间：2017-05-23 08:07:07

标签： machine-learning google-cloud-platform speech-to-text

是否可以使用Google Cloud Platform机器学习语音API自动检测口语？

https://cloud.google.com/speech/docs/languages表示支持的语言列表，用户需要手动设置此参数以执行语音到文本。

由于马赫什

2 个答案:

答案 0 :(得分：3)

截至上个月，Google在其语音到文本API中增加了对口语检测的支持。 Google Cloud Speech v1p1beta1

尽管有一点限制-您必须提供可能的语言代码列表，最多只能输入3种，并且据说只有语音命令和语音搜索模式才支持。如果您知道音频中可能还有其他语言，这很有用。

来自他们的文档：

alternative_language_codes []：字符串

可选最多3个其他BCP-47语言标签的列表，列出提供的音频的可能替代语言。查看语言支持当前支持的语言代码列表。如果列出了其他语言，识别结果将包含以最可能检测到的语言（包括主要语言）进行识别 language_code。识别结果将包含的语言标签音频中检测到的语言。注意：此功能仅支持语音命令和语音搜索用例和性能可能会因其他用例（例如电话录音）而异。”

答案 1 :(得分：1)

对Google Cloud Speech API的请求需要以下配置参数：encoding，sampleRateHertz和languageCode。 https://cloud.google.com/speech/reference/rest/v1/RecognitionConfig

因此，Google Cloud Speech API服务无法自动检测所使用的语言。该服务将由此参数（languageCode）配置，以开始识别该特定语言的语音。

如果您考虑与自动检测输入语言的Google Cloud Translation API并行，请考虑自动检测音频文件中使用的语言需要比文本更多的带宽，存储空间和处理能力文件。此外，Google Cloud Speech API还提供流式语音识别，这是一种实时语音到文本服务，其中特别需要languageCode参数。