https://stackoverflow.com/questions/49239919/pandas-groupby-quantile-transform的后续行动

时间:2018-03-12 19:23:20

标签: python pandas scikit-learn

我注意到sklearn对NaNs做了错误的事情:即它会窒息。 (这里有一个很大的讨论: https://github.com/scikit-learn/scikit-learn/issues/10404) 我想转换非NaN数据并单独留下NaN,输入如下:

date        ticker volume percent_change
2018-01-01  A       10000     0.01
2018-01-01  AA      15000     0.002
2018-01-01  AAPL    20000     NaN
2018-01-01  FB      10000     0.05
2018-01-02  A       10000     -0.01
2018-01-02  AA      15000     0.03
2018-01-02  AAPL    20000     -0.02
2018-01-02  FB      10000     -0.01

(也许AAPL当天没有交易)。

除了为sklearn家伙屏住呼吸以解决这个问题,或者实现我自己的变换器(如果在python中完成,这将非常慢,如果在C中完成,很难集成),是否还有其他一些做法此?

0 个答案:

没有答案