在DF中输入缺失数据和预测数据

时间:2019-07-15 13:36:53

标签: python-3.x pandas split

我有一个200 cols和30k行的数据。我有一个丢失的数据,我想预测它会填充丢失的数据。我想预测无值并将预测的数据放在那里。 我想按索引拆分数据,在已知数据上训练模型,预测未知值,加入已知值和预测值,然后将它们返回到完全相同位置的数据。

P.S。中值,dropna和其他方法并不有趣,只是预测缺失值。

sub macro1()
    Dim rngarr() As Variant
    Dim divisor As Double
    Dim targetcol As Long
    Dim targetrow As Long
    Dim pasterange As Range

    rngarr = Range("A1:AX3").Value
    'Remember that your array starts at index 1
    'A range that starts at row 2 will still have an index 1
    targetcol = 2
    targetrow = 2

    divisor = 0.5

    rngarr(targetrow, targetcol) = rngarr(targetrow, targetcol) * divisor

    Set pasterange = Range("A5:AX7")

    pasterange = rngarr
end sub

同一DF,所有cols由数据合并。

2 个答案:

答案 0 :(得分:0)

我也不太了解您的问题,但是我可能对您有个想法。看一下fancyimpute软件包。该软件包为您提供了基于预测模型(例如KNN)的估算方法。希望这能解决您的问题。

答案 1 :(得分:0)

很难理解这个问题。但是,似乎您可能对此问题和答案感兴趣。

Using a custom function Series in fillna

基本上(通过链接),您会

  1. 创建具有预测值的列
  2. 使用fillna作为该列的参数