在我上传数据时使用openrefine,然后单击文本构面然后进行群集。它创建了集群。喜欢:Aniket Ghodke和Ghodke Aniket它会建议合并它们。但有什么方法可以存储这些值。就像我合并了#34; Aniket Ghodke"和#34; Ghodke Aniket"说" Aniket Ghodke"然后我可以存储这些值以供我进一步参考。我也准备使用Python或java库了。但是有可能吗?
答案 0 :(得分:0)
您可以通过GREL调用大多数群集功能,如ngram(value,4)
或fingerprint(value)
。您可以将结果存储在新列或构面中以探索结果。
This blog post解释如何使用它们。