如何在Google Refine中构建多个列

时间:2012-03-05 00:47:37

标签: openrefine

我有一个包含30列和多行的数据集(某些单元格没有数据)。我希望能够成组分组。

     1 2 3 4...
Row1 A B C D
Row2 E A D F
Row3 Q A B H  

鉴于上述数据,我希望facet重新调整一组列中的实例数。对于前三列我需要返回facet:

A - 3  
B - 2  
C - 1  
D - 1   
E - 1  
Q - 1 

我在加载数据时尝试组合列,但个别数据也已分组。这不是理想的结果。例如:

ABC - 1  
EAD - 1  
QAB - 1

提前致谢。

2 个答案:

答案 0 :(得分:2)

我无法想到一种更有效的方法来做到这一点,但你可以用以下方式做一个自定义方面:

[ cells.["1"].value, cells.["2"].value, cells.["3"].value ]

其中“1”,“2”和“3”是列的名称。如果您的列名称是单个词,例如“V1”,“V2”,“V3”等,您还可以将自定义构面更改为:

[ cells.V1.value, cells.V2.value, cells.V3.value ]

有很多专栏,这个解决方案可能有点单调乏味......

答案 1 :(得分:2)

您是否尝试将所有列转换为一个并在此“主列”上进行转换?

转置时添加列名,以便了解数据的来源。您可以将主列拆分为“源列”和“数据”。

您可以在此处找到转置大量列的JSON代码:http://googlerefine.blogspot.ca/2011/09/json-code-to-transpose-important-number.html

它适用于您的项目,只需进行有限的编辑。

希望有所帮助!