我有一个看起来像这样的熊猫数据框:
我想填充ID列-如果ID为空,则填充上一行的值,如果不为空,则保留当前ID值。 我使用了for循环来执行此操作,但是这种方法非常慢。 我的数据框可以包含500,000行,我需要一种效率更高的方法。 你有什么主意吗?
这是我期望的输出:
这是我现在使用的脚本,非常慢:
data.sort_values(['Tool','Date'], inplace= True)
for index in np.arange(len(data)):
print(index)
if data.iloc[index]['ID']=='':
data.iloc[index, data.columns.get_loc('ID')] = data.iloc[index-1]['ID']
del index