我正在学习熊猫,但是我对它的工作方式感到困惑。 如果我有此数据框:
name region_id device prod_id date
0 NAME_01 442317 TV 169398 2012-02-01
1 NAME_01 89803 TV 87465 2012-03-01
2 NAME_02 9157 TV 73769 2012-03-01
3 NAME_02 145563 TV 76560 2012-03-01
4 NAME_03 412738 TV 87786 2012-03-01
如何获取每个名称的region_id列表?例如,我需要这个:
NAME_01: [442317, 89803]
NAME_02: [9157, 145563]
NAME_03: [412738]
感谢RafaelC。
接着,从上方迭代结果的最佳方法是什么?对于每个ID(在每个名称中),我将在另一个数据框中找到出现的位置,并且需要计数,即每个ID在第二个数据框中包含的总次数。示例:
region_id
0 442317
1 442317
2 442317
3 9157
4 9157
因此,对于属于一个名称的每个id(来自第一个数据帧),我可以看到在第二个数据帧中可以找到此计数:
name region_id count
NAME_01 442317 3
...
NAME_02 9157 2
...
如何执行该操作?