打开精炼文本构面集群

时间:2014-10-11 20:52:48

标签: python openrefine

在我上传数据时使用openrefine,然后单击文本构面然后进行群集。它创建了集群。喜欢:Aniket Ghodke和Ghodke Aniket它会建议合并它们。但有什么方法可以存储这些值。就像我合并了#34; Aniket Ghodke"和#34; Ghodke Aniket"说" Aniket Ghodke"然后我可以存储这些值以供我进一步参考。我也准备使用Python或java库了。但是有可能吗?

1 个答案:

答案 0 :(得分:0)

您可以通过GREL调用大多数群集功能,如ngram(value,4)fingerprint(value)。您可以将结果存储在新列或构面中以探索结果。

This blog post解释如何使用它们。