我正在做一个涉及设计网站的单一项目。我处于发展的早期阶段,只想澄清我对迄今为止学到的知识。我的网站将包含一个数据库(可能是SQL或Oracle),带有powerpoint,word和其他一些文件,但主要是这些文件。
我可以使用Lucene: 1)使用关键字搜索我的网站以查找和检索相关页面 2)从数据库中搜索并提取相关的powerpoint和word文件
从我收集的核心Lucene将索引我的网站和数据库,并找到相关的页面和文件。我需要添加其他软件,例如抓取工具和用户界面。
正如我所说,我是新手,而且一开始就很复杂,但到目前为止我收集到的是正确的吗?
非常感谢,
菲尔
答案 0 :(得分:1)
1)您需要创建一个lucene索引。
2)一种方法是使用nutch来抓取您的网站,它会返回一个lucene索引,它会将您网站上的所有链接/数据编入索引。
3)我相信你也可以为数据库创建一个lucene索引。