根据前几行中的值填充熊猫数据框的列的最有效方法是什么?

时间:2020-02-12 14:14:30

标签: python pandas performance dataframe apply

我有一个看起来像这样的熊猫数据框:

enter image description here

我想填充ID列-如果ID为空,则填充上一行的值,如果不为空,则保留当前ID值。 我使用了for循环来执行此操作,但是这种方法非常慢。 我的数据框可以包含500,000行,我需要一种效率更高的方法。 你有什么主意吗?

这是我期望的输出:

enter image description here

这是我现在使用的脚本,非常慢:

data.sort_values(['Tool','Date'], inplace= True)
for index in np.arange(len(data)):
    print(index)
    if data.iloc[index]['ID']=='':
        data.iloc[index, data.columns.get_loc('ID')] = data.iloc[index-1]['ID']
del index

0 个答案:

没有答案