标签: python machine-learning signal-processing mfcc
我目前正在尝试使用Python的标准麦克风实现简单的文字识别。我已经采样数据并从音频信号中提取MFCC矩阵。但问题是:我应该如何处理这些功能来获取电话或识别单词? 注意:我要承认的字样代表人的正确名称。 提前谢谢。