我有一个包含名称和相关数字的数据框。问题是这些值不与名称相关联。下面是一个例子:
所有值都应与在值开始出现之前开始的名称相关联。结果应该是这样的:
我正在努力想出可以完成这项工作的逻辑,任何帮助将不胜感激。我可以弄清楚如何自行删除第二个示例中显示的空白值。
谢谢!
答案 0 :(得分:1)
import pandas as pd
import numpy as np
如果您的 'Name' 列不包含 NaN(它包含 ''
或 ' '
),则使用 replace()
方法(如果它包含NaN's
然后忽略这一步):
df['Name']=df['Name'].replace('',np.nan,regex=True)
df['Name']=df['Name'].replace(' ',np.nan,regex=True)
只需使用 ffill()
方法:
df['Name']=df['Name'].ffill()
或
您也可以通过 fillna()
方法执行此操作:
df['Name']=df['Name'].fillna(method='ffill')
现在如果你打印 df
你会得到你想要的输出