Question

我正在学习熊猫，但是我对它的工作方式感到困惑。如果我有此数据框：

   name        region_id  device  prod_id        date
0  NAME_01     442317     TV      169398  2012-02-01
1  NAME_01      89803     TV       87465  2012-03-01
2  NAME_02       9157     TV       73769  2012-03-01
3  NAME_02     145563     TV       76560  2012-03-01
4  NAME_03     412738     TV       87786  2012-03-01

如何获取每个名称的region_id列表？例如，我需要这个：

NAME_01: [442317, 89803]
NAME_02: [9157, 145563]
NAME_03: [412738]

感谢RafaelC。

接着，从上方迭代结果的最佳方法是什么？对于每个ID（在每个名称中），我将在另一个数据框中找到出现的位置，并且需要计数，即每个ID在第二个数据框中包含的总次数。示例：

   region_id
0     442317
1     442317
2     442317
3     9157
4     9157

因此，对于属于一个名称的每个id（来自第一个数据帧），我可以看到在第二个数据帧中可以找到此计数：

name     region_id   count
NAME_01  442317      3
...
NAME_02  9157        2
...

如何执行该操作？

大熊猫中的聚集和多个联接

0 个答案: