读取csv文件pandas

时间:2015-07-27 05:24:21

标签: python pandas

这是我的数据集的示例。

在[54]中:

user1 = pd.read_csv('dataset/1.csv')
In [55]:

user1
Out[55]:
          0     0.69464     3.1735  7.5048
0   0.030639    0.149820    3.48680 9.2755
1   0.069763    -0.299650   1.94770 9.1120
2   0.099823    -1.688900   1.41650 10.1200
3   0.129820    -2.179300   0.95342 10.9240
4   0.159790    -2.301800   0.23155 10.6510
5   0.189820    -1.416500   1.18500 11.0730

如何按下第一列并在第一列上添加名称列[TIME,X,Y和Z]。

所需的输出如下:

        TIME        X           Y       Z
0        0      0.69464     3.1735  7.5048
1   0.030639    0.149820    3.48680 9.2755
2   0.069763    -0.299650   1.94770 9.1120
3   0.099823    -1.688900   1.41650 10.1200
4   0.129820    -2.179300   0.95342 10.9240
5   0.159790    -2.301800   0.23155 10.6510
5   0.189820    -1.416500   1.18500 11.0730

6 个答案:

答案 0 :(得分:31)

我这样做:

colnames=['TIME', 'X', 'Y', 'Z'] 
user1 = pd.read_csv('dataset/1.csv', names=colnames, header=None)

答案 1 :(得分:3)

如果我们直接使用来自csv的数据,它将根据逗号分隔值给出组合数据,因为它是.csv文件。

user1 = pd.read_csv('dataset/1.csv')

如果要使用pandas添加列名,则必须执行以下操作。但是下面的代码不会为您的列显示单独的标题。

col_names=['TIME', 'X', 'Y', 'Z'] 
user1 = pd.read_csv('dataset/1.csv', names=col_names)

要解决上述问题,我们必须添加大熊猫支持的额外填充,标头=无

user1 = pd.read_csv('dataset/1.csv', names=col_names, header=None)

答案 2 :(得分:3)

除了上述答案之外,如果您的数据集已经有列名并且您想用自定义名称替换它,那么设置 header=0 而不是 header=None

答案 3 :(得分:2)

我们只需一行代码即可完成

 user1 = pd.read_csv('dataset/1.csv', names=['TIME', 'X', 'Y', 'Z'], header=None)

答案 4 :(得分:0)

constructor(props){
    super(props);
    this.state = {
        images: [],
    }
}

const tempImages = this.state.images;
tempImages.splice(index, 1);
this.setState({ images: tempImages });
read_csv函数中的

names参数用于定义列名称。如果您在此列表中传递额外的名称,它将使用该名称添加另一个具有NaN值的新列。

header =没有用于修剪列名称的CSV文件已存在。

答案 5 :(得分:0)

如果数据集过大,请使用 nrows=1 以避免消耗加载时间。