我正在尝试编写一个独特的应用程序,并使用语音命令来触发应用程序中的特定功能

时间:2010-01-17 10:27:19

标签: iphone command voice

如果有人可以帮我解决这个问题,我将永远负债累累。

没有陷入细节困境,我正在尝试编写应用程序 例如,当应用程序当前启动时,如果我说的话, “激活功能A”,我的应用程序中已存在的特定功能,已激活。

我是否清楚地解释过自己?换句话说,在手机的屏幕上是一个按钮 其中写着“功能A”。当软件“武装”并处于聆听模式时,我想要 用户能够简单地说出“激活功能A”这个词, (或我选择的任何其他短语)和屏幕选项将被选择而不需要 用户用手按下按钮,而是选择/激活该选项 通过语音命令。

我的程序员和我在使用这种新的语音命令功能时遇到了困难, 例如,即使显然可以使用语音命令进行谷歌搜索。 其他语音命令应用程序目前正在流通,例如SMS听写应用程序, 电子邮件编写应用程序等,因此显然可以创建语音命令应用程序。 有谁知道这是否可能,如果有的话,你有没有关于如何实施的建议 这个功能?

问题2

假设我们无法通过语音命令激活功能A,是否可能 使用语音命令使电话发出呼叫,并接收此呼叫 我们的服务器?然后服务器“ping”iPhone并指示它激活功能A? 要使此解决方法起作用,我需要能够确定确切的短语。 换句话说,不能强迫用户使用“呼叫功能A”这个词。我需要的 能够选择启动该功能的短语。 希望我已经清楚了。

换句话说,作为我们所面临的障碍的潜在解决方法 使用语音命令激活我们的应用程序中的特定功能,是否可能 利用手机中已有的语音命令功能?又名,放置 一个电话?然后我们的服务器和服务器接收到此调用 因此ping通话的电话,并指示它激活功能?

我显然明白应用程序目前正在推出之前的必要性 我的应用程序可以从服务器接收指令。

如果有人可以帮助我解决这个令人烦恼的问题,那么说这并不夸张 你会改变我的生活!

非常感谢你们中任何一个善良的人可以提供的帮助!

迈克尔

1 个答案:

答案 0 :(得分:0)

我不相信iPhone配备了任何内置的语音识别功能。考虑与Nuance谈论购买和嵌入他们的一个语音识别引擎。他们有适用于iPhone的DragonDictate,但它们也提供了相当数量的其他识别引擎,可以提供不同的功能。嵌入式解决方案显然是他们的专业领域之一。

将音频推送到服务器的另一条路径可能比您预期的更为复杂。通常,该过程涉及端点(当存在语音时)和基本特征的识别,因此不需要传递原始流。同样,调查您打算使用的语音识别引擎可能会为您提供所需的数据处理详细信息。将所有手机中的连续原始语音传递到您的服务器可能不太实际。