高方差分析的方差分析

时间:2020-02-13 08:11:18

标签: python categories correlation anova

我有多个基本主分类特征,也有多个基本主分类特征。目标特征是数字。我可以通过以下代码了解低基数特征与目标变量之间的相关性

oc

此处,上述功能基数较低,只有两个不同的值。如果特征具有高基数(例如400个不同的值),我如何找到相关性。任何建议和替代想法表示赞赏。谢谢您的耐心等候

1 个答案:

答案 0 :(得分:0)

假设vals是值列表

df_arr = [df[df.some_variable==val].Target for val in vals]
F, p = stats.f_oneway(*df_arr)