我正在尝试开发一个阅读评估员(阅读辅导员的子集 - http://www.cs.cmu.edu/~listen/,它基于CMUSphnix语音识别器)。我的评估员主要用于测试英语中的韵律(或流利程度),但是对于尚未提供的印度口音。
具体来说,我会给读者提供一个阅读测试,其中包含500-1000字的固定故事。将记录和分析语音数据的暂停,休息,音调,强度等,最后根据评估将分数分配给读者。
现在。这是捕获。对于较新的语言,HTK需要预先指定(1)语法,(2)发音模型和(3)声学模型(训练)。虽然在我的情况下,由于故事是固定的,并且与庞大的英语词汇相比非常小,我认为可能不需要这么做。
我是这个领域的初学者,所以有人可以指导我(a)最简单且省力的方法来最初测试这个我自己的快速演示(骨架)? (b)在上述三种模型中,应该改变什么以及如何为2-3个固定故事开发可靠的可测试原型? (c)非常感谢让我开始这个项目或任何其他建议/批评的任何其他帮助。
P.S。请注意,我们只会使用英语,但在印度场景中进行测试;我们的总字数将低至约100-200,所以我觉得识别准确性可以比通常的工具更好的努力(培训,语法模型等)。
非常感谢。