我在学术研究项目中使用IBM Watson Personality Insights。
从目前的分析来看,我注意到同一条推文的原始分数和百分位数通常经常有很大差异,并且在某些情况下,分数甚至在相反的两端(例如,可接受性原始分数:0.21和可接受百分位数) 0.76)。此外,就我的样本人群的总体水平而言,百分位数分数的人格特征内的方差高得多,而原始分数的人格特征内的方差非常低(所有观察值均在每个特征0.1-0.2范围内)。
我了解到,百分位数是归一化的分数,分数的解释也不同。我的问题是研究者通常将哪个分数用于回归分析(例如,个人的人格特质-成功)?在我看到的应用“个性分析”的论文中,作者没有讨论他们使用的得分。如果您对此有任何想法,并可以与任何通过Personality Insights更详细地讨论其方法的研究进行共享,那就太好了。
非常感谢您的指导!
答案 0 :(得分:1)
您是正确的,分数有不同的解释。原始分数就是这样,原始分数在更大的人群中。尽管特质原始分数的范围实际上是从0到1,但情况并非总是如此,并且分数可能集中在较窄的范围内。这就是为什么在上面显示的示例中,原始分数的微小变化会在百分位数分数上产生更大的变化。
请注意,为了计算百分位数,我们针对较大的人口(100K)运行了配置文件,您会在较小的样本中观察到这些趋势。
关于您的其他问题;您会使用哪个得分非常取决于。通常,大多数人使用百分位分数,因为这样可以使您了解给定的人群与总体人口的比较。例如,如果我有兴趣查看一组与另一组的比较,则使用百分位分数可以更直观地理解差异(25%的可接受性差异比原始差异0.1更容易理解)因为您不知道这是否有意义)。 另一方面,原始分数主要在您创建更大的模型并将PI分数用作功能之一时使用。在这种情况下,使用原始分数通常会很有帮助,因为您可以从较大的模型得出自己的结论。