应用错误收集

我正在尝试开发一个阅读评估员（阅读辅导员的子集 - http://www.cs.cmu.edu/~listen/，它基于CMUSphnix语音识别器）。我的评估员主要用于测试英语中的韵律（或流利程度），但是对于尚未提供的印度口音。

具体来说，我会给读者提供一个阅读测试，其中包含500-1000字的固定故事。将记录和分析语音数据的暂停，休息，音调，强度等，最后根据评估将分数分配给读者。

现在。这是捕获。对于较新的语言，HTK需要预先指定（1）语法，（2）发音模型和（3）声学模型（训练）。虽然在我的情况下，由于故事是固定的，并且与庞大的英语词汇相比非常小，我认为可能不需要这么做。

我是这个领域的初学者，所以有人可以指导我（a）最简单且省力的方法来最初测试这个我自己的快速演示（骨架）？（b）在上述三种模型中，应该改变什么以及如何为2-3个固定故事开发可靠的可测试原型？（c）非常感谢让我开始这个项目或任何其他建议/批评的任何其他帮助。

P.S。请注意，我们只会使用英语，但在印度场景中进行测试;我们的总字数将低至约100-200，所以我觉得识别准确性可以比通常的工具更好的努力（培训，语法模型等）。

非常感谢。