来自mysql数据库的关键字/短语密度

时间:2010-11-01 20:59:21

标签: php lucene sphinx keyword

我有一个LAMP设置,mysql数据库基本上是产品目录。由于数据库在添加新产品时频繁更改,因此手动维护关键字和常用短语列表非常麻烦。保留关键字/词组列表的需要有两个:(1)谷歌adwords和其他营销活动,(2)我网站上的链接结构。

我一直在使用Zend Lucene端口作为我网站上所有搜索的主干。是否可以使用Lucene来确定关键字密度和/或短语密度?那另一个搜索引擎呢?

为了进一步明确我正在寻找的东西,让我们说我有一个笔记本电脑目录。我可能有各种型号的戴尔Inspiron,戴尔Latitude,Macbook,Gateway,联想和宏基笔记本电脑。对于关键字密度报告,我希望看到“笔记本电脑”和“笔记本电脑”这两个词很受欢迎,也许还有“戴尔Inspiron”或“戴尔Inspiron笔记本电脑”或“联想笔记本电脑”。

有人可以推荐一些入门的东西吗?我有点像Lucene,Sphinx,Solr等整个搜索模块世界,因为它已经索引数据,但我不知道我是否走错了路。

谢谢!

1 个答案:

答案 0 :(得分:2)

Lucene能够为您提供(关键字,频率)对的列表。请参阅this questionthis blog post