更改大熊猫数据框子集的随机样本的列值?

时间:2018-10-25 02:10:35

标签: python pandas

具有以下格式的熊猫数据框

col1 col2 col3     tochange
a1   a2   group1   a4
b1   b2   group1   b4
...
i1   i2   group2   i4
...

其中col3表示每行标签的二进制类别(即,一行可以在group1或group2中)。

对于行2组中的数据帧子集的随机采样,希望将tochange值设置为某个常数。就是将数据帧子集 df[df['col3'] == 'group2']中X个随机行的tochange值都更改为某个恒定值,例如“ changed”。

当前正在研究sample(X),但不确定如何将返回样本的那些索引映射回原始数据框以更改该行的列。任何有关如何完成最终尝试在此处完成的建议或建议,将不胜感激。

1 个答案:

答案 0 :(得分:2)

在查询组2之后使用struct。假设您要随机采样n

Header