我注意到sklearn
对NaNs做了错误的事情:即它会窒息。
(这里有一个很大的讨论:
https://github.com/scikit-learn/scikit-learn/issues/10404)
我想转换非NaN数据并单独留下NaN,输入如下:
date ticker volume percent_change
2018-01-01 A 10000 0.01
2018-01-01 AA 15000 0.002
2018-01-01 AAPL 20000 NaN
2018-01-01 FB 10000 0.05
2018-01-02 A 10000 -0.01
2018-01-02 AA 15000 0.03
2018-01-02 AAPL 20000 -0.02
2018-01-02 FB 10000 -0.01
(也许AAPL当天没有交易)。
除了为sklearn家伙屏住呼吸以解决这个问题,或者实现我自己的变换器(如果在python中完成,这将非常慢,如果在C中完成,很难集成),是否还有其他一些做法此?