熊猫:数据文件中没有列名

时间:2016-07-06 15:41:13

标签: python python-2.7 numpy pandas

我正在尝试处理数据集以使用DataScience,但它没有列名。 df.head()的输出如下所示:

   1  73                  Not in universe   0  0.1   0.2  Not in universe.1
0  2  58   Self-employed-not incorporated   4   34     0    Not in universe
1  3  18                  Not in universe   0    0     0        High school
2  4   9                  Not in universe   0    0     0    Not in universe
3  5  10                  Not in universe   0    0     0    Not in universe
4  6  48                          Private  40   10  1200    Not in universe

我希望看到的是

0  1  73                  Not in universe   0  0.1   0.2  Not in universe.1
1  2  58   Self-employed-not incorporated   4   34     0    Not in universe
2  3  18                  Not in universe   0    0     0        High school
3  4   9                  Not in universe   0    0     0    Not in universe
4  5  10                  Not in universe   0    0     0    Not in universe
5  6  48                          Private  40   10  1200    Not in universe

我可以指定随机列名但有更好的方法吗?

2 个答案:

答案 0 :(得分:6)

您加载了文件时没有指定是否有标题行,默认情况下它会从第一行推断出来,如果它没有,则传递header=None

df = pd.read_csv(file_path, header=None)

答案 1 :(得分:0)

我希望你通过this link。标头的默认值为'infer',这意味着如果未指定,它将自动设置数据的整数值。

您还可以通过设置名称参数来设置不同的列名,该参数采用数组,列名列表。