如果第一行包含缺失数据,如何分配列标题

时间:2019-05-06 23:48:06

标签: pandas numpy

我正在尝试使用df将列标题分配给df.columns = ['a', 'b', 'c', 'd']

但是,我的某些数据在第一行中缺少值,并且分配的列标题比第一行中的列更多,这会导致错误。在这种情况下,如何分配标题而不丢弃第一行?

示例:

    No_hat     |         |
    green_hat  |  green  |   1
    red_hat    |  red    |   2

    df.columns = ['Hat', 'Color', 'quantity']

    Hat       |   Color   | quantity
-------------------------------------
    No_hat    |   Null    |  Null
    green_hat |   green   |  1
    red_hat   |   red     |  2

2 个答案:

答案 0 :(得分:0)

您可以使用

df=df.T.reset_index().T
df.columns=['Hat', 'Color', 'quantity']

答案 1 :(得分:0)

我找到了解决方案,以防万一有人遇到同一问题。

在读取文件时,使用pd.read_csv(df.csv, names=['Hat', 'Color', 'Quantity'])将自动用空值替换缺少的值并分配列标题。