读取URL和解析信息

时间:2013-08-16 16:51:21

标签: php

我有一个包含5000行URL的txt文件。我想要做的是打开每个网址来提取每个网址(第一个网址有)。 我的问题是,脚本第一行打开URL并告诉我有多少链接没有问题。但是对于文件中URL的其余部分没有显示任何内容......数组显示如下:

Array
(
)
Array
(
)

我的代码:

$homepage = file_get_contents('***mytxt file****');

$pathComponents = explode(",", trim($homepage)); //line breaker

//echo "<pre>";print_r($pathComponents);echo "</pre>";

$count_nlines = count($pathComponents);

for ($i=0;$i<3;$i++) {

$request_url = $pathComponents[$i];
//echo $request_url . "<br>";

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);    // The url to get links from
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // We want to get the respone
$result = curl_exec($ch);

$regex='|<a.*?href="(.*?)"|';
preg_match_all($regex,$result,$parts);
$links=$parts[1];

echo "<pre>";print_r($links);echo "</pre>";

curl_close($ch);
}

有什么想法吗?!

1 个答案:

答案 0 :(得分:0)

看起来你正在经历错误的事情。尝试更改此内容:

for ($i=0;$i<3;$i++) {

对此:

for ($i = 0; $i <= count($pathComponents); $i++)