如何通过其属性(大数据集)汇总数据?

时间:2019-01-17 23:06:15

标签: excel vba bigdata

我目前在excel中有大量数据(600,000行长)。 我所拥有的是某个州在所有不同状态下的某种植物的世代,我想做的就是拥有一个州的全部世代。将各个工厂数据汇总为状态数据的快速方法是什么。

我在这里提供了一个很小的例子:

example data

主要挑战在于,我的AA1 = QLD表是一个单独的文档,并不像我的示例中那样简单,实际上,每个州有50多种不同的植物,而这些植物没有命名模式。

我认为唯一可以解决此问题的方法是编写一条大约400行长的iff语句,这当然是不可行的。

任何帮助将不胜感激。

谢谢

1 个答案:

答案 0 :(得分:2)

首先将您的文档转移到表格中

enter image description here

然后添加一个帮助程序列,该列将正确的状态与表中的正确的植物对齐。一个简单的VLOOKUP可以做到这一点:

WITH path, collect(PDP) AS pdps, sum(PDP) AS sum1
WITH collect({path: path, pdps: pdps}) AS allData, sum(sum1) AS DWPC
UNWIND allData AS data
UNWIND data.pdps AS PDP
RETURN
  data.path AS path,
  PDP,
  100 * (tofloat(PDP) / DWPC) AS PERCENT_OF_DWPC
ORDER BY PERCENT_OF_DWPC DESC

enter image description here

然后使用现有表和新的帮助器列中的数据插入数据透视表。在行中放置=VLOOKUP(A2,I:J,2,FALSE) ,在值中放置State

enter image description here