多索引或词典

时间:2014-11-05 20:48:28

标签: python pandas hierarchy multi-index

我正在尝试分析几个热建筑模拟的结果。每个模拟生成几个变量的小时数据以及分析建筑物的每个房间。可以针对不同场景重复模拟,并且这些场景中的每一个将针对每个房间和每个变量产生不同的每小时数据集。

目前,我为每个场景创建了一个单独的数据框(带有变量和房间的Multiindex)。我的目标是能够比较不同维度的不同场景:相同的房间,平均房间,时间平均等。

据我所知,目前有两种选择:

  1. 创建数据框字典,其中键表示方案
  2. 在表示方案的同一数据框中为多重索引添加一个额外级别(第3个)
  3. 以上哪项将在性能和灵活性方面给我最好的结果。

    典型问题可能是:

    • 在哪种情况下,平均室温低于阈值更长时间
    • 在哪种情况下,最高室温低于阈值
    • 每个房间7月的平均温度是多少

    正如您所看到的,我需要在不同的层次级别执行操作:在场景中以及不同场景之间的比较。

    将所有内容保存在同一数据框中还是分发数据会更好吗?

1 个答案:

答案 0 :(得分:0)

总的来说,根据我的经验,比较不同的数据框架比较困难,所以我建议使用一个。 通过一些实际例子,我可以尝试提供更好的建议。

但是,我个人更喜欢使用额外的列而不是许多Multiindex级别,但这仅仅是我个人的观点。