如何在我的博客软件中添加标签建议功能?

时间:2009-03-20 08:43:33

标签: tags

我正在为运行在cms上的网站创建博客功能。

我的要求是:

当某人撰写文章时,他必须自动提供“建议的标签”。这些话必须来自这篇文章。我该如何实现此功能?

我想到了一些想法。像:

  1. 建议最长的词。使用这个,我可以过滤掉'a','of','my'等但不是'因为'。
  2. 创建单词黑名单。但我找不到任何这样的现成清单,创建这样的清单需要很长时间。
  3. 那么,还有其他想法吗?

1 个答案:

答案 0 :(得分:0)

你可以Bayesian classification看看会发生什么。这是一些example code

更新:这预先假定您有一些标签供分类器选择。如果您需要初始化标记列表,则可以使用simple algorithm从文本中提取关键字。