将行程聚合到流网络数据帧中

时间:2017-02-22 22:04:56

标签: python pandas dataframe

所以,我只是在学习Python,而且我遇到了一些麻烦, 我正在处理一个包含欧洲447个地区的数据集,并且(在清理数据之后)这些地区之间的货运量大约为200,000次,运费不同。

我需要根据这些数据构建两个矩阵;

1)区域之间的聚合旅行(可能是每种模式)

2)国家之间的总体旅行(因此没有在国内运输)

旅行数据的例子:

 From   To  Mode    Volume_ton
     1      2     1      371246
     7      423   2      10587
     245   123    1      6841

(所以来往:447个地区,模式:道路= 1铁路= 2,

如何使用From和To"坐标"构建一个新的数据框,以下列形式将相同组合的所有行程相加:

#   0   1    2    3    4    5    6    ...
0
1
2
3
4
...

行是Origin,列是目的地

接下来的问题是如何将其汇总到国家/地区矩阵中。 这些数字确实附有代码,我已经构建了一本字典。

1 个答案:

答案 0 :(得分:0)

如果没有更可重复的示例数据帧,很难说肯定。但我会这样做:

totals = (
    pandas.groupby(by=['To', 'From'])['Volume_ton']
        .sum()
        .unstack(level='From')
)