我有一个csv文件,其中保存了这样保存的粒子的位置和速度:
x, y, z, vx, vy, vz
-0.960, 0.870, -0.490, 962.17, -566.10, 713.40
1.450, 0.777, 2.270, -786.27, 63.31, -441.00
-3.350, -1.640, 1.313, 879.20, 637.76, -556.24
-0.504, 2.970, -0.278, 613.22, -717.32, 557.02
0.338, 0.220, 0.090, -927.18, -778.77, -443.05
...
我正在尝试读取此文件,并使用read_csv将其另存为Pandas数据框。但是,调用除第一列之外的任何列时,我都会得到错误
AttributeError:“ DataFrame”对象没有属性“ y”
我永远都不会收到“ x”列的错误,所以我写了一个代码段以查看是否可以找出读取错误的出处。
import pandas as pd
data = pd.read_csv('snap.csv')
print data
print data.x
print data.y
控制台正确打印出
x y z vx vy vz
0 -0.960 0.870 -0.490 962.17 -566.10 713.40
1 1.450 0.777 2.270 -786.27 63.31 -441.00
2 -3.350 -1.640 1.313 879.20 637.76 -556.24
3 -0.504 2.970 -0.278 613.22 -717.32 557.02
4 0.338 0.220 0.090 -927.18 -778.77 -443.05
...
表示它正在为列分配正确的名称。然后
0 -0.960
1 1.450
2 -3.350
3 -0.504
4 0.338
...
显示它可以正确取出其中的一列。但是,当尝试打印第二列时,它将再次引发错误
AttributeError:“ DataFrame”对象没有属性“ y”
然后,我遍历data.itertuples()单独打印第一行,以查看其外观,并确认名称仅分配给第一列,而没有分配其他名称。
Pandas(Index=0, x=-0.96, _2=0.87, _3=-0.49, _4=962.17, _5=-566.1, _6=713.4)
数据没有其他问题。所有值均对应于正确的索引。只是名称分配不正确,并且只能按名称调用第一列。我尝试在每个列名的两边加上单引号,这显示出完全相同的错误。 我知道有一些方法可以解决此问题,例如在read_csv函数中分配名称,但我很好奇问题的实质,以避免再次发生这种情况。
答案 0 :(得分:1)
尝试在创建数据框时声明列名称。
df = pd.DataFrame(pd.read_csv(“file.csv”), columns=[“x”, “y”, “z”, “vx”, “vy”, “vz”])
答案 1 :(得分:0)
df = pd.read_csv("snap.csv",names =["x", "y", "z", "vx", "vy", "vz"])