我尝试编写一个可以测试用户发音的程序。
这个程序会播放一个波形声音,比如一个英文句子,用户会试着发出声音并录制他的声音,程序会检查这些波形的相似性,并指出用户的发音。
问题是,是否可以使用.net编写此程序?如果是,我可以使用哪些库?任何入门指南?
答案 0 :(得分:1)
梅苏特!
假设您使用的是C#.NET,我可能会为您解答。一个简单的谷歌搜索让我看到了这个YouTube视频,它向您展示了如何“绘制音频波形”:http://www.youtube.com/watch?v=ZnFoVuOVrUQ
祝你好运,剩下的由您决定!
答案 1 :(得分:1)
音乐识别程序通常表示谱域中的声音(以捕捉音高)。
从某些光谱表示中,可以使用距离测量(欧几里德或其他)。
对于言语,时间维度是必要的。
在空间域中,考虑时间变形(慢速与快速)的变形措施似乎也是一个不错的选择。
模板匹配算法可能是很好的候选者,就像在OCR算法中一样,但现在你将处理声波。
声波算法的一般考虑因素是滑动窗口或分割。