标签: python-3.x cluster-analysis
我有一个数据集:
我想应用聚类技术来创建每5分钟数据的聚类,并想要计算最后一列的平均值,即拥塞百分比。
如何每5分钟创建一次此类群集?我想进一步使用这种分析来做决策。该决定将根据计算的平均百分比进行。
答案 0 :(得分:0)
这是一个简单的聚合,而不是集群。
使用循环,一次读取一条记录,每5分钟输出一次,并重新初始化累加器。
或者将时间用于5分钟的粒度。然后取现在相同键的平均值。这将是一个SQL GROUP_BY。