Heyall,
我正在攻读计算机科学硕士论文。更具体地说,我正在研究在用作统计依赖性解析器中的特征时调整分布式语义模型的超参数的效果。我正在使用word2vec,一种非确定性的基于神经网络的字嵌入软件。为了能够验证我的结果,我必须量化模型中非确定性的程度。
但我认为可以在更抽象的层面上提出这个问题 - 我可以使用什么样的测试来量化统计模型中的非确定性程度?比如说,当我五次执行相同的实验时,我得到以下结果:
created_at
如何确定我的系统“非确定性”,并将其作为接受或放弃未来实验结果的基础?
答案 0 :(得分:2)
如果通过测试你的意思是重要性或假设检验,那些测试就没用了,你可以忽略它们。
量化语言分析或其他任何不确定性的适当方法是将不确定性表示为概率。在语言分析的上下文中,这意味着在可能的方式上解析给定句子的概率分布。
如果您需要做出决定,您需要提供表示对结果的偏好的其他数据(即效用函数)。概率和效用通过所谓的预期效用假设相结合:最佳行动是最大化预期效用的行为。
这些概念的有用介绍,使用来自许多领域的例子,是罗伯特克莱门的“做出艰难的决定”。更具体的问题是,对概率语言解析的网络搜索会引发很多命中。
您可能会对stats.stackexchange.com上的这个问题更感兴趣。那里可能已经有相关问题的答案。