我是机器学习的新手,并且在一年的时间内为一组100人拥有一个非常大的数据集。目标是根据他们的午餐时间找出谁是伙伴。
我有以下数据集:
Person StartTime EndTime Duration(dif for start and end times)
Person1 Time11 Time12 diff1
Person2 Time21 Time22 diff2
Person3 Time31 Time22 diff3
Person4 Time41 Time32 diff4
现在我想根据他们的时间聚集/组合人们(时间差为+/- 5分钟,这意味着如果人1的开始时间和结束时间是12:00 - 1:00 PM,那么人2是11:55 - 1:05他们属于与人相同的群体1)
非常感谢任何帮助。
答案 0 :(得分:0)
基于此得出图表。边缘的重量是午餐时间的重叠。也许可以通过午餐时间,同时吃午餐的人数来标准化,也可以添加非线性加权,例如log(1 +持续时间)。
在结果图上,运行社区检测算法。