如何使用google speech api识别代码切换混合语言?

时间:2018-03-28 15:29:15

标签: api speech-recognition multilingual google-speech-api speech-synthesis

通常人们使用他们的母语+英语进行对话。我需要谷歌api识别语音样本中的两种语言。

例如:" aaj ka天气kaisa hai"这句话包含印地语(hi-IN)和英语(en-IN)语言

如何设置api参数以识别代码切换混合或多语言语音?

2 个答案:

答案 0 :(得分:1)

你不能混合语言。

语音识别大致包含3部分 - >声学模型,语言模型和字典。

声学模型是数据训练的结果,包含音频信号和语音之间的关系

字典包含单词及其发音方式,例如,单词TOP在一般语音识别字典上发音为“T AH P”。

语言模型是用于创建句子的单词之间的连接,例如单词“I”与“am”相关联,因此语音识别器很少(或从不)给出“我是”或“我是”的结果。

每种语言都有自己的声学模型(语音),词典(单词)和语言模型(句子),所以我们可以将它们混合起来。

问题:还可以吗?

答案是:是!

您可以使用许多工具构建自己的语言(在本例中为印地语+英语),我已经尝试过这种工具称为 CMU Sphinx / Pocket Sphinx。您可以构建自己的模型,训练它,以及从中制作一本字典。这将是很多工作,但你可以配置语音识别所需的任何东西。

任何平台实施的链接:https://github.com/cmusphinx

答案 1 :(得分:0)

Google语音API无法以这种方式运行,并且它不是专为混合语言设计的。印度很少有公司为印地语+英语案例开发了专门的API,他们认为这种混合语言很好。