所以,我只是在学习Python,而且我遇到了一些麻烦, 我正在处理一个包含欧洲447个地区的数据集,并且(在清理数据之后)这些地区之间的货运量大约为200,000次,运费不同。
我需要根据这些数据构建两个矩阵;
1)区域之间的聚合旅行(可能是每种模式)
2)国家之间的总体旅行(因此没有在国内运输)
旅行数据的例子:
From To Mode Volume_ton
1 2 1 371246
7 423 2 10587
245 123 1 6841
(所以来往:447个地区,模式:道路= 1铁路= 2,
如何使用From和To"坐标"构建一个新的数据框,以下列形式将相同组合的所有行程相加:
# 0 1 2 3 4 5 6 ...
0
1
2
3
4
...
行是Origin,列是目的地
接下来的问题是如何将其汇总到国家/地区矩阵中。 这些数字确实附有代码,我已经构建了一本字典。
答案 0 :(得分:0)
如果没有更可重复的示例数据帧,很难说肯定。但我会这样做:
totals = (
pandas.groupby(by=['To', 'From'])['Volume_ton']
.sum()
.unstack(level='From')
)