我是熊猫新手。我有一个包含6列的Dataframe,我想做一个执行此操作的for循环:
- 创建一个新列(nc 1) -nc1 =第1列 - 第2列
我想为所有列迭代这个,所以最后一个是: ncx =第5栏第6列
我可以像这样减去列:
df['nc'] = df.Column1 - df.Column2
但是当我尝试循环时这没用,因为我总是要插入colums的名字。
有人可以通过告诉我如何将列称为数字来帮助我吗? 谢谢!
答案 0 :(得分:0)
In [26]: import numpy as np
...: import random
...: import pandas as pd
...:
...: A = pd.DataFrame(np.random.randint(100, size=(5, 6)))
In [27]: A
Out[27]:
0 1 2 3 4 5
0 82 13 17 58 68 67
1 81 45 15 11 20 63
2 0 84 34 60 90 34
3 59 28 46 96 86 53
4 45 74 14 10 5 12
In [28]: for i in range(0, 5):
...: A[(i + 6)] = A[i] - A[(i + 1)]
...:
...:
...: A
...:
Out[28]:
0 1 2 3 4 5 6 7 8 9 10
0 82 13 17 58 68 67 69 -4 -41 -10 1
1 81 45 15 11 20 63 36 30 4 -9 -43
2 0 84 34 60 90 34 -84 50 -26 -30 56
3 59 28 46 96 86 53 31 -18 -50 10 33
4 45 74 14 10 5 12 -29 60 4 5 -7
In [29]: nc = 1 #The first new column
...: A[(nc + 5)] #outputs the first new column
Out[29]:
0 69
1 36
2 -84
3 31
4 -29
在这里,您不需要通过名称,只需按列号来调用它,您只需编写一个调用列+ 5的简单函数
这样的事情:
In [31]: def call_new_column(n):
...: return(A[(n + 5)])
...:
...:
...: call_new_column(2)
Out[31]:
0 -4
1 30
2 50
3 -18
4 60