我正在尝试使用df
将列标题分配给df.columns = ['a', 'b', 'c', 'd']
但是,我的某些数据在第一行中缺少值,并且分配的列标题比第一行中的列更多,这会导致错误。在这种情况下,如何分配标题而不丢弃第一行?
示例:
No_hat | |
green_hat | green | 1
red_hat | red | 2
df.columns = ['Hat', 'Color', 'quantity']
Hat | Color | quantity
-------------------------------------
No_hat | Null | Null
green_hat | green | 1
red_hat | red | 2
答案 0 :(得分:0)
您可以使用
df=df.T.reset_index().T
df.columns=['Hat', 'Color', 'quantity']
答案 1 :(得分:0)
我找到了解决方案,以防万一有人遇到同一问题。
在读取文件时,使用pd.read_csv(df.csv, names=['Hat', 'Color', 'Quantity'])
将自动用空值替换缺少的值并分配列标题。