如何为我的自定义PHP搜索引擎索引页面到MySQL

时间:2012-10-06 22:20:00

标签: php javascript mysql search-engine

我有一个简单的PHP脚本,可以在MySQL数据库表中搜索所请求的关键字。但是,我正在尝试创建一个PHP脚本,给定一个URL将导入该页面并获取“内容”ID内的所有内容。这可能吗?如果不是,我愿意使用JavaScript / jQuery。

提前致谢:)

如果您需要进一步澄清,请告诉我。

2 个答案:

答案 0 :(得分:1)

您可能会发现此扩展程序非常有用: http://www.php.net/manual/en/book.dom.php

以下代码段将返回id =“content”的元素的内容:

  $url = 'http://www.example.com/';

  $doc = new DomDocument;
  $doc->load($url);

  $content_element = $doc->getElementById('content');
  $contents = $doc->saveXML($content_element); 

答案 1 :(得分:0)

是的,这是可能的,我建议可以使用cURL。

然后您可以输入一个URL,它将抓取该页面。

<?php

$ch = curl_init('http://finance.google.com/finance');

curl_setopt($ch,CURLOPT_HEADER,0); 

curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); // Give us the page source

$cr = curl_exec($ch);

preg_match_all('/href="()"/i',$cr,$pm,PREG_SET_ORDER);

print_r($pm);

foreach($pm as $pv) echo $pv[1] . "\r\n";

?>

您将要编辑该preg匹配项,以确保您只获得所需内容,然后将其拆分并插入数据库。

请注意,这不是带宽效率很高。