我是熊猫的新手,在对一行数据使用merge
,join
和concatenate
函数时遇到了麻烦。
我要遍历表中的少数行,并在每次迭代中将我发现的一些数据添加到要处理的行中。我知道,亵渎!您不得迭代。每次迭代都会导致对服务器的调用,因此我需要控制流程。没有那么多行。仅供我使用。我保证我不应该迭代。
此外,我的基本问题是:如何将数据添加到给定的行中,其中新数据优先于现有数据并具有新列?
假设我有一个要逐行遍历的DataFrame df
:
> df
c1 c2 c3
0 a b c
1 d e f
并且在第0行进行迭代时,我得到了一些要添加到第0行的新数据。这些新数据在df_a
中:
> df_a
c4 c5 c6
0 g h i
我想将数据从df_a
添加到df
的第0行,所以df
现在是:
> df
c1 c2 c3 c4 c5 c6
0 a b c g h i
1 d e f NaN NaN NaN
接下来,我在第1行进行迭代,并得到一些重叠的列,而某些列不在df_b
中:
> df_b
c5 c7 c8
0 j k l
再次,我想将此数据添加到第1行,以便df
现在有了
> df
c1 c2 c3 c4 c5 c6 c7 c8
0 a b c g h i NaN NaN
1 d e f NaN j NaN k l
我无法列出列名,因为我不知道它们将是什么,新的列可能会出现在我的控制范围之外。行没有键,因为断开连接后整个东西都被扔掉了。我在每次迭代期间发现的数据总是会覆盖df
中当前的内容。
谢谢!