使用Ruby-on-Rails,Sphinx或UltraSphinx以及HTML源代码(不是数据库)

时间:2009-07-29 17:10:52

标签: ruby-on-rails sphinx ultrasphinx

sphinx-0.9.9-rc2的文档说明:

要编制索引的数据通常来自非常不同的来源:SQL 数据库,纯文本文件,HTML文件,邮箱等。

但是,除了SQL之外,我找不到有关设置源的任何文档。配置文件似乎并不表示源可以是除数据库之外的任何内容。任何人都有任何有用的链接用于使用HTML源设置sphinx?

1 个答案:

答案 0 :(得分:1)

您是否正在寻找Sphinx上的xmlpipe(现在称为xmlpipe2)功能?我已经尝试过使用XML文件,它的工作原理与SQL相同。

我还没有尝试过带有vanilla HTML文件的Sphinx,所以我猜你需要解析你的HTML文件并使用你想要索引的属性/字段创建XML文件,并使用xmlpipe将它们提供给Sphinx。

您可以查看herehere了解更多信息。

HTH