Swift中的“声音”识别?

时间:2015-04-22 03:43:35

标签: ios swift audio sound-recognition

我正在申请Swift的应用程序,我正在考虑在我的项目中获得非语音声音识别的方法。

我的意思是有一种方法可以让我接受声音输入并将它们与已经包含在项目中的预定义声音相匹配,如果匹配发生,它应该做一些特定的动作吗?

有没有办法做到以上几点?我正在考虑分解声音并进行检查,但似乎没有比这更进一步了。

2 个答案:

答案 0 :(得分:2)

我的个人经历遵循上面关于matt的评论:需要严格的技术知识。

有几种方法可以做到这一点,其中一种方法通常如下:从感兴趣的声音片段中提取一些属性(音频特征提取),并使用某种机器学习技术对此音频特征向量进行分类。这通常需要一些训练阶段,其中机器学习技术被给出一些示例以了解您想要识别的声音(您的预定义声音),以便它可以根据该数据构建模型。

在不知道您希望识别哪种类型的声音的情况下,也许我们的C / C ++ SDK可以为您提供帮助:http://www.samplesumo.com/percussive-sound-recognition 该页面上有一个技术演示,您可以下载并尝试使用您的声音。它是一个C / C ++库,有Mac,Windows和iOS版本,所以你应该能够将它与iOS上的Swift应用程序集成。也许这会让你做你需要的事情吗?

如果您想开发自己的技术,您可能希望首先使用关键词“声音分类”,“音频识别”,“机器收听”,“音频特征分类”,查找和阅读一些科学论文。

答案 1 :(得分:1)

马特,

我们一直在开发一系列很酷的工具来加速iOS开发,特别是在Swift中。其中一个工具就是我们所说的TLSphinx:一个围绕Pocketsphinx的Swift包装器,可以在没有音频离开设备的情况下执行语音识别

我认为TLSphinx可以帮助您解决问题,因为它是一个完全开源的库。在Github(' TLSphinx')上搜索它,你也可以下载我们的iOS应用程序(' Tryolabs Mobile Showcase')并试用该模块以了解它是如何工作的。 希望它有用!

最佳!