重新排列数据库以选择特征

时间:2018-11-08 20:56:06

标签: python pandas data-science logistic-regression pca

我有一个数据框,我想执行回归,但是我有很多不同的功能,因此我想执行PCA以减少功能数量。出于此练习的目的,我的功能是Bname(列值),当我尝试按区域进行旋转时,会遇到很多NAN。有没有一种方法可以解决这个问题,而不是用0填充NAN,我们只需从数据库中删除该特定值,然后执行PCA? 这是数据库的样子:

Index Wk   Bname     Items_sold  PricePerUnit Promo  Bfamily REGION
0   201503 Mercurial  16           $99.9       1     NIKE
1   201503 Mercurial  10           $129.99     0     NIKE
2   201503 F50        19           $149.99     0     NAN
3
.
.
9999999

0 个答案:

没有答案