openrefine标志改变了行

时间:2014-05-07 17:41:06

标签: data-cleansing openrefine opendata

我正在使用openrefine来清理excel数据集。我有大约70个操作,我一直在剪切和粘贴不同的数据集。我保持记录ID并导出到新的Excel工作表。然后我使用记录ID重新加载工作表。

它运行良好,但即使只有少数记录发生变化,我也必须重新加载整个数据库。是否有一种简单的方法来标记更改的记录,因此我只将已更改的记录导出/导入应用程序?

我是否可以轻松地在70个操作中添加标记以仅标记已更改的记录?

1 个答案:

答案 0 :(得分:1)

目前在OpenRefine中没有直接的方法可以做到这一点,但它会产生一个有趣的feature request。目前执行此操作的最佳方法可能是使用CSV或TSV文件并在之前和之后进行差异处理。在文件提出要加载的delta之后。