我有一个大约10000行的数据集。第一列是客户的订单。第二列是他的进入时间。第三列是他离开商店的时间。因此,第一行表示第一个客户在2016年1月1日00:01进入并在2016年1月1日13:28离开。我想创建第四列,表示当前商店中有多少客户。我该怎么做?
No. entering_time leaving_time CustomerAtStore
1 1 2016-01-01 00:01:00 2016-01-01 13:28:00 0
2 2 2016-01-01 00:05:00 2016-01-01 13:32:00 1
3 3 2016-01-01 00:08:00 2016-01-01 00:14:00 2
4 4 2016-01-01 00:14:00 2016-01-01 02:43:00 2
5 5 2016-01-01 00:17:00 2016-01-01 01:00:00 3
6 6 2016-01-01 00:35:00 2016-01-01 04:09:00 4
7 7 2016-01-01 00:37:00 2016-01-01 01:19:00 5
8 8 2016-01-01 00:39:00 2016-01-01 20:26:00
9 9 2016-01-01 00:52:00 2016-01-01 03:44:00
10 10 2016-01-01 00:54:00 2016-01-01 04:49:00
这是我的伪代码,受Python的启发。 1.创建一个空列表。 2.使用for循环来运行迭代。 3.将每一行追加到创建的列表中。 4.使用if语句比较新客户的输入时间和已经在列表中的人的所有离开时间。删除那些早于或等于新客户进入时间的人。 5.返回列表的长度并将此编号分配给correspondenceind字段。
这是我的想法。但我不知道如何在R中实现它。 非常感谢。