Question

我正在尝试处理数据集以使用DataScience，但它没有列名。 df.head()的输出如下所示：

   1  73                  Not in universe   0  0.1   0.2  Not in universe.1
0  2  58   Self-employed-not incorporated   4   34     0    Not in universe
1  3  18                  Not in universe   0    0     0        High school
2  4   9                  Not in universe   0    0     0    Not in universe
3  5  10                  Not in universe   0    0     0    Not in universe
4  6  48                          Private  40   10  1200    Not in universe

我希望看到的是

0  1  73                  Not in universe   0  0.1   0.2  Not in universe.1
1  2  58   Self-employed-not incorporated   4   34     0    Not in universe
2  3  18                  Not in universe   0    0     0        High school
3  4   9                  Not in universe   0    0     0    Not in universe
4  5  10                  Not in universe   0    0     0    Not in universe
5  6  48                          Private  40   10  1200    Not in universe

我可以指定随机列名但有更好的方法吗？

Answer 1

您加载了文件时没有指定是否有标题行，默认情况下它会从第一行推断出来，如果它没有，则传递header=None：

df = pd.read_csv(file_path, header=None)

Answer 2

我希望你通过this link。标头的默认值为'infer'，这意味着如果未指定，它将自动设置数据的整数值。

您还可以通过设置名称参数来设置不同的列名，该参数采用数组，列名列表。

熊猫：数据文件中没有列名

2 个答案: