添加具有发生次数的列,为每条记录重置

时间:2020-07-22 10:47:49

标签: openrefine

我有行数可变的记录和具有7个可能值的A列,它们都是可重复的。

我需要基于A的新列B,该列显示每条记录每个值的出现次数。该计数应在每条记录中重置。

我设法在A列中对行进行了排序,但在每条记录中按字母顺序对它们进行排序,但是我找不到正确的表达式来进行计数。我只能设法通过所有数据集(使用文本facet或facetCount)来获取A中值出现的总数。

有任何线索吗?

2 个答案:

答案 0 :(得分:0)

如果您有这个...

enter image description here

...想要这个...

enter image description here

...最简单的方法是打开Jython / Python(而不是GREL)并在“基于此列添加列”窗口中使用此公式:

return row.record.cells['col2'].value.count(value)

只需用您的实际列名替换 col2

答案 1 :(得分:0)

我在 the mailing list row.record.toRowIndex-row.record.fromRowIndex

上发现了以下 GREL 表达式

它在大型项目上的执行速度更快。