应如何根据显着性水平选择列,以及应该选择哪些因素来决定给定DataFrame列的优先级
A B C D E F G H
5 61.0 77.0 40.0 46.0 60.0 73.0 66.0 1.0
4 60.0 51.0 49.0 59.0 59.0 67.0 69.0 3.0
3 35.0 32.0 48.0 57.0 43.0 34.0 34.0 4.0
2 17.0 16.0 22.0 12.0 15.0 5.0 5.0 1.0
1 10.0 7.0 11.0 3.0 4.0 5.0 8.0 4.0
首先,每个索引都是用户对不同功能(列)的评分。我将每列的count_values
串联起来,现在试图了解哪些功能(列)与用户更相关。从上面的df中,我必须选择前三列。
如果有人需要进一步说明,请告诉我。