Pandas,substract columns循环中的数据帧

时间:2016-12-01 14:47:31

标签: python loops pandas dataframe

我是熊猫新手。我有一个包含6列的Dataframe,我想做一个执行此操作的for循环:

- 创建一个新列(nc 1) -nc1 =第1列 - 第2列

我想为所有列迭代这个,所以最后一个是: ncx =第5栏第6列

我可以像这样减去列:

df['nc'] = df.Column1 - df.Column2

但是当我尝试循环时这没用,因为我总是要插入colums的名字。

有人可以通过告诉我如何将列称为数字来帮助我吗? 谢谢!

1 个答案:

答案 0 :(得分:0)

In [26]: import numpy as np
    ...: import random
    ...: import pandas as pd
    ...: 
    ...: A = pd.DataFrame(np.random.randint(100, size=(5, 6)))

In [27]: A
Out[27]: 
    0   1   2   3   4   5
0  82  13  17  58  68  67
1  81  45  15  11  20  63
2   0  84  34  60  90  34
3  59  28  46  96  86  53
4  45  74  14  10   5  12

In [28]: for i in range(0, 5):
    ...:     A[(i + 6)] = A[i] - A[(i + 1)]
    ...: 
    ...: 
    ...: A
    ...: 
Out[28]: 
   0   1   2   3   4   5   6   7   8   9   10
0  82  13  17  58  68  67  69  -4 -41 -10   1
1  81  45  15  11  20  63  36  30   4  -9 -43
2   0  84  34  60  90  34 -84  50 -26 -30  56
3  59  28  46  96  86  53  31 -18 -50  10  33
4  45  74  14  10   5  12 -29  60   4   5  -7

In [29]: nc = 1 #The first new column
    ...: A[(nc + 5)] #outputs the first new column
Out[29]: 
0    69
1    36
2   -84
3    31
4   -29

在这里,您不需要通过名称,只需按列号来调用它,您只需编写一个调用列+ 5的简单函数

这样的事情:

In [31]: def call_new_column(n):
    ...:     return(A[(n + 5)])
    ...: 
    ...: 
    ...: call_new_column(2)
Out[31]: 
0    -4
1    30
2    50
3   -18
4    60