我正在尝试处理数据集以使用DataScience,但它没有列名。 df.head()
的输出如下所示:
1 73 Not in universe 0 0.1 0.2 Not in universe.1
0 2 58 Self-employed-not incorporated 4 34 0 Not in universe
1 3 18 Not in universe 0 0 0 High school
2 4 9 Not in universe 0 0 0 Not in universe
3 5 10 Not in universe 0 0 0 Not in universe
4 6 48 Private 40 10 1200 Not in universe
我希望看到的是
0 1 73 Not in universe 0 0.1 0.2 Not in universe.1
1 2 58 Self-employed-not incorporated 4 34 0 Not in universe
2 3 18 Not in universe 0 0 0 High school
3 4 9 Not in universe 0 0 0 Not in universe
4 5 10 Not in universe 0 0 0 Not in universe
5 6 48 Private 40 10 1200 Not in universe
我可以指定随机列名但有更好的方法吗?
答案 0 :(得分:6)
您加载了文件时没有指定是否有标题行,默认情况下它会从第一行推断出来,如果它没有,则传递header=None
:
df = pd.read_csv(file_path, header=None)
答案 1 :(得分:0)
我希望你通过this link。标头的默认值为'infer',这意味着如果未指定,它将自动设置数据的整数值。
您还可以通过设置名称参数来设置不同的列名,该参数采用数组,列名列表。