标签: zend-framework web-crawler
是否有预先编写的PHP蜘蛛/抓取工具可用于将文档提供给Zend_Search_Lucene索引器?我发现Sphider但它与MySQL紧密耦合,并且无法与Zend Lucene轻松集成(据我所知)
我最初编写的搜索索引用于CMS / Wordpress页面保存,因此不需要蜘蛛网,但现在我们也需要集成外部网站。
答案 0 :(得分:1)
看看Spizer,它目前正在使用Zend Console运行表单CLI,所以我认为使用Zend_Search_Lucene实现自己的记录器应该不难。