在混乱的能源数据中查找层次结构

时间:2018-08-14 15:21:02

标签: python algorithm pandas numpy energy

我有一个建筑物中约25个电表的能量分布数据(以3小时为间隔进行采样),作为熊猫数据帧的时间序列。

电表形成一个层次结构,其中最高电表包括低电表的消耗数据。

例如,(可能的分层结构)

total
 - A
     - A1
     - A2
 - B
 - C
     - C1
     - C2 
          - C21
          - C22

其中较低的水平加总较高的水平消耗。 (例如C = C1 + C2)

现在的任务是识别数据中存在的固有结构,以用于其他能源数据分析。

是否有任何算法可用于从凌乱的数据中检测此分层结构? 我是否必须详尽地尝试所有可能的组合,比如说4级结构,以识别可能的匹配(由于数据杂乱,所以需要一定的容忍度)? 请建议某些策略从算法的角度来考虑这个问题。

注意:仪表名称是数字,不能直接解释为不同级别。我没有计费策略。能耗的大小有所不同(例如,很可能是A2> C(在上图中))。以更好的方式,层次结构只能表示级别之间的相对大小。

1 个答案:

答案 0 :(得分:2)

这个普遍的问题非常接近3SUM,不幸的是,还没有找到一个复杂度小于二次方的解决方案。

您最好的解决方案可能不会比穷尽尝试组合更好,但是使用n = 25应该不是太大的问题。