我有一个尺寸为26000x6的海量数据框,我想基于列的唯一值对一组特定条目进行简单的数学运算。问题是我不知道每个唯一值位于哪些行中,并且该列中有3000多个唯一值。该问题我该怎么办?太笼统了,很抱歉。我不是CS学生。
答案 0 :(得分:0)
您的问题有点含糊,但我想我理解您的要求。这是一个简单的例子。给定以下DataFrame df:
A B
1 4 0
2 2 2
3 4 1
您可以执行以下操作:
for i in df.itertuples():
if i.A == 4:
df.loc[i.Index, 'B'] += 1
我们正在遍历DataFrame的每一行,如果'A'列中的值为4,则在同一行中将'B'列中的值加1。