数据组织,按国家和年份

时间:2015-08-13 20:39:19

标签: excel data-cleaning

我目前有一个数据电子表格,我正在清理它以导入数据库以供进一步分析。目前的格式是:

    Country | Year | GDP
    --------------------
    USA     | 1950 | 5
    USA     | 1951 | 6
    ...
    GBR     | 1950 | 4
    GBR     | 1951 | 5

许多国家都是这样。我想要做的是转置这些数据,使其成为按国家/地区划分的表格,每个单元格是一个坐标GDP(国家,年份)。即:

Country | 1950 | 1951 | ...
-------------------------
USA     |  5   |  6  ... 
GBR     |  4   |  5

有一种简单的方法可以做这样的换位吗?我意识到它不起作用,因为每个国家都被重复过来。因此,经典的换位是不可用的,但好的是桌子是统一的,因为每个国家都有1950 - 2011年的行。我的工作流程包括Excel,R和SQLite。有没有办法构建一个sql脚本以这种方式导入行?我通常使用csv-to-sql转换器工具,但我希望db表以第二个表的方式构建。

这项任务的根本原因是我正在收集世界卫生组织的健康数据(格式如第二张表)和宾夕法尼亚州的经济指标(格式如第一张表格),并将查看两者之间的相关性,从而我希望所有表都具有相同的模式,以确保数据库的关系方面是直观的。我告诉你这是因为我认为某人可能有一个想法/解决方法可能会使我的原始请求变得不必要/无关紧要。

0 个答案:

没有答案