我需要处理一个数据集,以便可以将其与Google Fusion Tables映射。当前的xls数据格式如下:
Image of xls file with personal data anonymized
请注意,空白行表示新条目。我需要将列中的信息分类到适当标题下的行中,尤其是进行地理编码的地址。有什么想法吗?
答案 0 :(得分:0)
首先,进行一些清理以将第二列和第三列合并为单个列,然后使用功能Columnize by key/value column
将第三列和第四列中的数据转置为单独的字段。
完成此操作后,Fusion表应该能够根据地址对数据集进行地理编码。如果不是这种情况,则有很多教程使用OpenRefine对数据集进行地理编码。参见: