具有以下格式的熊猫数据框
col1 col2 col3 tochange
a1 a2 group1 a4
b1 b2 group1 b4
...
i1 i2 group2 i4
...
其中col3表示每行标签的二进制类别(即,一行可以在group1或group2中)。
对于行2组中的数据帧子集的随机采样,希望将tochange值设置为某个常数。就是将数据帧子集 df[df['col3'] == 'group2']
中X个随机行的tochange值都更改为某个恒定值,例如“ changed”。
当前正在研究sample(X),但不确定如何将返回样本的那些索引映射回原始数据框以更改该行的列。任何有关如何完成最终尝试在此处完成的建议或建议,将不胜感激。
答案 0 :(得分:2)
在查询组2之后使用struct
。假设您要随机采样n
Header