索引文件并通过Web应用程序进行搜索

时间:2011-07-25 14:00:02

标签: php indexing find search-engine

我在LAN上有一个包含大量PDF和DOC的共享文件夹。我想在php / Asp中创建一个网页,以便我可以为这些PDF和Doc编制索引,并在其中搜索内容。

搜索结果将显示相关结果。 我怎样才能做到这一点 ?什么程序?可以这样做吗?

3 个答案:

答案 0 :(得分:2)

所有Windows服务器版本都包含一个易于使用的索引服务,您可以以编程方式访问该服务,而无需安装任何第三方软件。这可以将您可以想到的几乎任何类型的文档编入索引,无论是本机还是third party iFilters

如果您使用的是Server 2003或更低版本,它可能已安装在您的服务器上,请进入计算机管理,它将列在“服务和应用程序”下。如果您在2008年,则将其添加到“Windows Server 2003文件服务”下的文件服务角色。

安装完成后,请按this guide to create a new index

它应该开箱即用索引Office文档,如果不是,你可以download the full Office iFilter pack for free。要索引PDF文件,您只需要在服务器上安装Adobe Reader,并且iFilter将与它一起安装。

您现在可以在ASP中开发自己的搜索页面来查询索引。它非常强大且速度超快,而且它遵守NTFS权限,因此您可以安全地索引所有文件,只要您使用Windows身份验证是IIS,搜索用户将只能看到他们有权访问的列出文件。 / p>

我们在所有办公室使用索引服务器取得了巨大的成功,我将看到我是否被允许开源我们的解决方案,但是all the code is out there anyway

您可use our solution as a base并且应该可以完全访问您的文件。

答案 1 :(得分:1)

您可以在多种解决方案中进行选择,所有这些解决方案基本上都要求您实施以下系统:

1)搜索引擎

2)(网络)客户端

也许更合适的解决方案是使用Solr作为引擎和PHP作为客户端。 你可以在这里找到一个启动教程:

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

答案 2 :(得分:0)

您可以动态创建树(任何递归树算法都可以),它将反映实际的文档结构,您可以在网页上显示树。

为了在网页上显示树,您可以使用PHP中的jquery / yui树结构。

在树的底部,您有文件。用户单击它时,您可以在浏览器上显示文件内容。

如果你的文件夹结构有太多级别,你可以使用一些缓存,这样你就不需要在需要时创建动态树。

希望这有助于......最好的。