我有一个保险公司的数据集,其中的问题由代理商处理(即每个公司最好有1位代理商)。因此,我们总共有539个组织,其中539个代理处理了分布在给定组织中的大约15000个文件。
但是数据有一定的偏差(1个文件由多个代理处理),我必须将其作为子集。下面是一个例子。
FileNo InsurerID
603338 Insurer5405
603338 Insurer5700
603338 Insurer5266
603338 Insurer5330
603338 Insurer5866
603338 Insurer5388
以上数据只是我所拥有的示例,其余数据要么由特定代理1次/多次处理。
根据文件编号查找子集记录。并由不同的员工处理相同的文件编号。