应用错误收集

我在学术研究项目中使用IBM Watson Personality Insights。

从目前的分析来看，我注意到同一条推文的原始分数和百分位数通常经常有很大差异，并且在某些情况下，分数甚至在相反的两端（例如，可接受性原始分数：0.21和可接受百分位数） 0.76）。此外，就我的样本人群的总体水平而言，百分位数分数的人格特征内的方差高得多，而原始分数的人格特征内的方差非常低（所有观察值均在每个特征0.1-0.2范围内）。

我了解到，百分位数是归一化的分数，分数的解释也不同。我的问题是研究者通常将哪个分数用于回归分析（例如，个人的人格特质-成功）？在我看到的应用“个性分析”的论文中，作者没有讨论他们使用的得分。如果您对此有任何想法，并可以与任何通过Personality Insights更详细地讨论其方法的研究进行共享，那就太好了。

非常感谢您的指导！

您是正确的，分数有不同的解释。原始分数就是这样，原始分数在更大的人群中。尽管特质原始分数的范围实际上是从0到1，但情况并非总是如此，并且分数可能集中在较窄的范围内。这就是为什么在上面显示的示例中，原始分数的微小变化会在百分位数分数上产生更大的变化。

请注意，为了计算百分位数，我们针对较大的人口（100K）运行了配置文件，您会在较小的样本中观察到这些趋势。

关于您的其他问题；您会使用哪个得分非常取决于。通常，大多数人使用百分位分数，因为这样可以使您了解给定的人群与总体人口的比较。例如，如果我有兴趣查看一组与另一组的比较，则使用百分位分数可以更直观地理解差异（25％的可接受性差异比原始差异0.1更容易理解）因为您不知道这是否有意义）。另一方面，原始分数主要在您创建更大的模型并将PI分数用作功能之一时使用。在这种情况下，使用原始分数通常会很有帮助，因为您可以从较大的模型得出自己的结论。

IBM Watson Personality Insights：使用原始分数还是百分位数？

1 个答案: