将网页划分为索引的程序

时间:2012-06-11 16:42:30

标签: indexing screen-scraping static-content

我一直在寻找一个从静态网页创建索引的程序。我不是在寻找像Solr或elasticsearch这样的程序,因为两者都假设我将以交互方式创建索引。我需要一些基本上可以转到网址的东西,并从它提取的页面创建一个搜索索引。它可以以任何必要的方式创建索引(db,xml等)我只是不需要与后端数据库访问和代码有关的程序,因为这种搜索非常轻,主要用于内部目的,在不使用其中任何一个的网站上。

感谢任何可能让我开始的提示或解答我的问题的答案!

1 个答案:

答案 0 :(得分:0)

调查Nutch。 Nutch可以索引一个URL,你可以索引的内容是非常可配置的。

完成抓取/索引后,该索引是可搜索的。没有编程。