自动使用某人的在线搜索数据库

时间:2014-03-02 20:51:07

标签: php search

在给定静态搜索的情况下,有没有人对自动使用某人在线搜索数据库的最佳方式有任何想法(参见示例)。它也可能使这个问题对于非静态搜索添加解决方案更有用。

例如,我有一个网站,我不想在此网站上创建指向某人的最新报告的PDF文件的链接:http://aris.empr.gov.bc.ca搜索条件不会改变,所有这些更新是数据库更新时的新结果,因此搜索结果始终为http://aris.empr.gov.bc.ca/search.asp?mode=find请注意,并非所有条目都有报告。

到目前为止,我的想法是使用php脚本搜索完成的搜索结果页面的源代码,搜索.pdf字符串的第一个实例,然后提取整个链接(页面按日期排序,所以找到的第一个pdf文件将是最新报告,其中包含pdf文件。

此解决方案的问题: 1)它对我的问题非常具体,只适用于静态搜索结果,因此不是一个好的Q& A 2)我不确定完成的搜索链接是否会在您每次关注时进行研究,或者是否会导致旧的结果可能会变得过时 3)如果你知道我的意思,我的解决方案并不性感,并且用胶带固定在一起。

谢谢, -Adrian

1 个答案:

答案 0 :(得分:1)

实际上你想要刮掉页面。

PHP中有2个选项:

1. Use CURL to fetch the page and USE PHP DOM parser to parse and extract the content from it.

2. You can use PHP Simple DOM Library, check here : http://simplehtmldom.sourceforge.net

它有现成的功能,你不需要在这里使用CURL。

我希望你有个主意。

尝试一些代码,在此向我们展示,我们将在此更多地介绍......