群集评论列表

时间:2014-03-03 07:49:24

标签: text-analysis carrot2

我是初学者,刚刚发现了伟大的Carrot2框架。

我尝试使用Java API通过LingoClusteringAlgorithm聚集Facebook注释列表(约100条注释,大约10-200个字符)。我可以将评论文本用作“标题”字段,并将字段“snippet”,“url”和“query”保留为空吗?或者有更好的方法(例如,对于“标题”和“片段”两次使用评论文本?)

1 个答案:

答案 0 :(得分:1)

至少有一个" title"或"摘录"必须为非空,因此您可以将帖子文本放在"代码段"并离开" title"空白。你是否离开" title"并不重要。或"摘录"空白,两种情况下的结果应该相同。

" url"字段仅用于显示目的,它不会影响聚类的结果。如果您打算在UI中使用它,可以将其留空或将直接链接添加到帖子中。