VectorSpaceModel Carrot2

时间:2014-06-06 19:14:02

标签: carrot2

在对文档进行聚类后,是否可以获得向量空间模型?

我在文档中看到,可以创建自己的向量空间模型:

public VectorSpaceModelContext(PreprocessingContext preprocessingContext)

预处理上下文将是:

PreprocessingContext(LanguageModel languageModel, List<Document> documents, String query)

使用我的文档列表,但这是在我将文档聚集之前。

我想要群集的矢量空间模型。

最后的手段是自己创造......

1 个答案:

答案 0 :(得分:0)

目前唯一的方法是修改算法的源代码,以将VSM公开为输出属性之一。为此,您需要:

  1. 定义VSM模型的输出属性(example for the Lingo algorithm

  2. 将创建的VSM模型保存到属性(example for the Lingo algorithm