抓取以从其他网站获取特定内容

时间:2013-12-09 14:19:29

标签: php web-crawler

我有一个搜索框....我想在框中输入一个值.....我有一些网站的网址,其中有所需的数据。例如

http://www.zafa.com.pk/tablets.html , http://www.zafa.com.pk/injections.html

当我点击搜索按钮时,脚本应仅返回内容与输入搜索值匹配的网站URL。请让我知道我该怎么做 我尝试了下面的代码,但它对我没有用

注意:我没有搜索整个网站,我只搜索网站的某些页面。

<?php 
  $ch = curl_init(); 
  curl_setopt($ch, CURLOPT_URL, 'http://www.google.com'); 
  curl_setopt($ch, CURLOPT_HEADER, 0); 
  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); 
  curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 300);
curl_setopt($ch, CURLOPT_TIMEOUT, 300);
  $data = curl_exec($ch); 
  file_put_contents("text.txt", $data);
  curl_close($ch); 
?>

1 个答案:

答案 0 :(得分:0)

你可以这样做:

注意:以下代码适用于单个网站。对于多个网站,您可以使用explode()foreach

$searc_in = file_get_contents('http://www.zafa.com.pk/tablets.html');
$findme = 'CARDACE';
$pos = strpos($searc_in, $findme);


if ($pos === false) {
    echo "The string '$findme' was not found in the website";
} else {
    echo "The string '$findme' was found in the website";
    echo " and exists at position $pos";
}