通过php提取网页内容

时间:2012-01-03 18:24:51

标签: php

  

可能重复:
  How to parse and process HTML with PHP?

<body> 
    <table align="center">

<?
 $ip=$_SERVER['REMOTE_ADDR'];
 $url=file_get_contents("http://whatismyipaddress.com/ip/$ip");
 preg_match_all('/<th>(.*?)<\/th><td>(.*?)<\/td>/s',$url,$output,PREG_SET_ORDER);
 for ($q=0; $q < 25; $q++) {
    if ($output[$q][1]) {
        if (!stripos($output[$q][2],"Blacklist")) {
            echo "<tr><td>".$output[$q][1]."</td><td>".$output[$q][2]."</td></tr>";

        }
    }
}
?> 
    </table>
</body> 

现在,通过此代码,我可以获得很多信息,例如isp,country等。

如何提取内容以便将其加载到我的数据库中,例如$ country,$ isp等?我认为如果将它转换为xml就可以完成,但我不确定。

1 个答案:

答案 0 :(得分:2)

您正在寻找 PHP Simple HTML DOM Parser

使用它你可以:

$html = file_get_html('http://www.google.com/');

以及稍后从html使用解析器中定义的函数,比如find和其他人获取单个标签..

Read this