我无法使用 weka 库处理群集。我有字符串属性,所以我使用StringToWordVector过滤器,但是如何在集群之后从WordVector转回字符串表示以显示“人类可读”的结果? 我想恢复此操作:
StringToWordVector filter = new StringToWordVector();
filter.setInputFormat(instancesToFilter);
Instances dataFiltered = Filter.useFilter(instancesToFilter, filter);
可能吗?
答案 0 :(得分:2)
StringToWordVector
过滤器无法撤消。但是,您至少有两种可能性:
ID
属性,确保在群集期间不使用该属性(以避免意外行为),然后从中恢复文本原始字符串(ARFF
文件)。答案 1 :(得分:1)
过滤器有损。
因此,不存在(精确)逆转换。不过,你可以用某种方式近似它。
考虑查看过滤器的源代码。